Háskóli Íslands

Samhengisháð ritvilluleit

Verkefnið hlaut styrk frá Rannsóknasjóði (RANNÍS) 2007-2008.

Verkefnisstjóri: Eiríkur Rögnvaldsson.

Meðumsækjendur/verkefnisstjórn: Hrafn Loftsson og Sigrún Helgadóttir.

Helstu starfsmenn (rannsóknamenn): Anton Karl Ingason og Skúli Bernhard Jóhannsson.

Um verkefnið á vefsíðu RANNÍS

Um verkefnið:

Markmið verkefnisins var að rannsaka og þróa aðferðir við samhengisháða ritvilluleit í íslenskum texta. Flest villuleitarforrit, þ.á.m. Púki Friðriks Skúlasonar, skoða aðeins einstök orð og meta hvort þau séu rétt rituð. Verulegur hluti stafsetningarvillna felst þó ekki í því að notaðar séu rangt ritaðar orðmyndir, heldur í því að nota leyfilegar orðmyndir á óleyfilegum stöðum í setningu. Slíkar villur er ekki hægt að greina nema skoða orðamynstur, málfræðimynstur og orðastæður, nýta tíðniupplýsingar og tölfræðileg líkön. Takmarkið var að til yrði annars vegar ítarleg greining og lýsing á þeim aðferðum sem unnt er að beita í þessum tilgangi, og hins vegar hugbúnaður sem nýtir þessa greiningu í villuleit.

Helstu fræðirit og greinar sem spruttu/hafa sprottið upp úr verkefninu:

Anton Karl Ingason, Sigrún Helgadóttir, Hrafn Loftsson og Eiríkur Rögnvaldsson. 2008. „A Mixed Method Lemmatization Algorithm Using a Hierarchy of Linguistic Identities (HOLI)”. Bengt Nordström og Aarne Ranta (ritstj.): Advances in Natural Language Processing (Lecture Notes in Computer Science, Vol. 5221), bls. 205-216. Springer, Berlín.

Anton Karl Ingason, Skúli Bernhard Jóhannsson, Eiríkur Rögnvaldsson, Hrafn Loftsson og Sigrún Helgadóttir. 2009. „Context-Sensitive Spelling Correction and Rich Morphology”. Jokinen, Kristiina, og Eckhard Bick (ritstj.): Proceedings of the 17th Nordic Conference of Computational Linguistics NODALIDA 2009. NEALT Proceeding Series 4. Northern European Association for Language Technology (NEALT), bls. 231-234. Tartu University Library. Sjá grein og um bókina.

Helstu ráðstefnufyrirlestrar tengdir verkefninu:

Anton Karl Ingason, Skúli Bernhard Jóhannsson, Eiríkur Rögnvaldsson, Sigrún Helgadóttir og Hrafn Loftsson. 2009. „Context-Sensitive Spelling Correction and Rich Morphology”. Nodalida 17, Óðinsvéum, 16. maí.

Anton Karl Ingason. 2009. „Eyríki finnst málfræði skemmtileg”. Hugvísindaþing, Háskóla Íslands, Reykjavík, 14. mars.

Anton Karl Ingason, Sigrún Helgadóttir, Hrafn Loftsson og Eiríkur Rögnvaldsson. 2008. „A Mixed Method Lemmatization Algorithm Using a Hierarchy of Linguistic Identities (HOLI)”. GoTAL, Gautaborg, 25. ágúst.

Anton Karl Ingason og Skúli Bernhard Jóhannsson. 2008. „Samhengisháð ritvilluleit. Tækni á næsta leyti?". Íslensk tungutækni 2008. Tungutæknisetur, Reykjavík, 18. apríl.

Anton Karl Ingason. 2008. „Lemmald: Nýtt lemmunarforrit fyrir íslensku". Íslensk tungutækni 2008. Tungutæknisetur, Reykjavík, 18. apríl.

Þú ert að nota: brimir.rhi.hi.is