Informationsextrahering |
Med stödet av språkmotorn kan mängder av olika typer information utvinnas från svenska texter: nya ord, underlag för författarbestämning eller textkategorisering. Information som utvinns kan användas för att beteckna stilen på ett dokument - nedan jämförelse av ett riksdagsdokument och ett brev från barn till Gud. |
Offentligt och vardagligt språk |
Parameter |
Jämförelse |
||
Antal satser |
55 |
55 |
samma längd i satser |
Exempel på möjliga urval (från riksdagsdokumentet): ämnesområde, sammansatta substantiv, samhällsrelaterade ord. |
«- Tillbaka