Jazykový korektor Opravidlo.cz je aktuálně nejkomplexnější volně dostupný nástroj pro opravu jazykových chyb a překlepů, který svou funkčností předčí známý korektor v aplikaci Microsoft Word. Vzniklo díky meziinstitucionální spolupráci, na které se podíleli rovněž akademičtí pracovníci a studenti z Ústavu českého jazyka FF MU. Autorky projektu Dana Hlaváčková (DH) a Hana Žižková (HŽ) hovoří o vzniku Opravidla, jeho funkčnosti a významu pro veřejnost.
Můžete prosím představit webovou aplikaci Opravidlo?
DH: Opravidlo je komplexní korektor českých textů, který opravuje nejen překlepy, ale taky pravopisné, gramatické a typografické chyby. Uživatel do něj může přímo psát nebo vložit napsaný text.
HŽ: Doplnila bych, že to je volně dostupný online nástroj, který můžete používat bez registrace. Je všem přístupný přes webové rozhraní a neshromažďuje žádné osobní údaje o uživatelích.
Kdo jeho vznik inicioval?
HŽ: Iniciátorem byla doktorka Hlaváčková.
DH: Ale něco tomu předcházelo. Kolega Vojtěch Kovář vedl několik prací studentů počítačové lingvistiky, které byly zaměřeny na dílčí úkoly využitelné pro jazykový korektor. Například jeden z nich řešil, jak naprogramovat pravidla pro doplňování interpunkce. Když už těch prací bylo několik a byly úspěšné, rozhodla jsem se do toho vstoupit. Domluvili jsme se, že bychom zkusili udělat reálný jazykový korektor, a napsali jsme projekt v rámci programu ÉTA Technologické agentury České republiky (TA ČR), který byl určen pro humanitní a společenské vědy. Podařilo se nám získat grant, a tak jsme dostali zdroj financování, bez kterého by Opravidlo pravděpodobně nevzniklo.
Jak jste navázali spolupráci s ostatními institucemi či pracovišti, které se na tvorbě aplikace podílely?
DH: Nemuseli jsme složitě hledat partnery, kteří by se na vývoji Opravidla chtěli podílet. Vytipovali jsme si, s kým bychom chtěli spolupracovat, a následně se domluvili na spolupráci. S kolegy z Ústavu pro jazyk český Akademie věd České republiky jsme se znali již dříve. Jelikož mají na starost Jazykovou poradnu a Internetovou jazykovou příručku (IJP), starali se při vývoji Opravidla o jazykovou správnost a o jeho propojení právě s IJP. Spolupráce s Ústavem teoretické a komputační lingvistiky Filozofické fakulty UK nám umožnila získat do týmu spolupracovníky, kteří se podíleli na vývoji známého korektoru v aplikaci Microsoft Word. S firmou Seznam.cz jsme zase spolupracovali už na předešlých projektech, protože zde pracují bývalí zaměstnanci Fakulty informatiky MU, a díky tomu spolupráce probíhala poměrně hladce. Dále s námi spolupracovali kolegové z mladé firmy EVE Technologies, s. r. o. Aplikačním garantem byla již jmenovaná společnost Seznam.cz a po ní nezisková organizace Wikimedia ČR.
Účastnili se práce na projektu i studenti Filozofické fakulty Masarykovy univerzity (FF MU)?
DH: Ano, tým ze strany FF MU byl složený z akademických pracovníků a doktorandů, kteří tvořili formální jazyková pravidla rozpoznávající chyby jak v typografii, tak v gramatice a pravopisu. Využívali přitom řešení popsaná ve vlastních závěrečných a disertačních pracích. A studenti bakalářského a magisterského stupně nám pomáhali testovat stabilitu serveru při jeho zatížení.
HŽ: Kromě testování stability serveru se studenti počítačové lingvistiky a českého jazyka podíleli i na zpracování dat a v počátečních fázích anotovali chyby v autentických českých textech.
Je projekt Opravidlo ukončený, nebo na něm nadále probíhají úpravy?
DH: No, projekt je ukončený a volně dostupný. Přesto ještě na Opravidle v několika lidech pracujeme, abychom ho mohli vylepšit a nabízet v takové podobě, aby ho veřejnost mohla bez potíží používat. Pokud se nám podaří získat finanční prostředky, připravíme novou verzi a plánujeme, že část bude volně dostupná a část bude zpoplatněna.
Můžete mi prosím vysvětlit, jak Opravidlo funguje?
DH: Pokusím se to říct jednoduše. Když do aplikace napíšeme nebo vložíme text, tak jej nejdřív rozdělí na jednotlivá slova. Potom proběhne morfologická analýza využívající data z rozsáhlého morfologického slovníku, přičemž se k jednotlivým slovům přiřadí informace o tom, jaký je to slovní druh apod. Poté proběhne syntaktická analýza, při níž se analyzuje celá věta a určí se větné členy, například podmět a přísudek. Následně program hledá podle formálních jazykových pravidel pravopisné, gramatické a typografické chyby. Pokud budeme mít například slovo myš s „i“, tak ho program zaznamená jako chybu a podtrhne ji, protože takové slovo v českém slovníku není. Uživatel dokonce dostane vysvětlení, proč je to chyba. Pokud půjde o překlep, bude rozpoznán korektorem překlepů, který je postavený na obsáhlém slovníku, kde se porovnává tvar slova z textu se slovníkem, a když ho nenajde, tak jej korektor označí podtržením.
HŽ: Ještě bych doplnila, že Opravidlo využívá více než 7 500 formálních jazykových pravidel, jež sepsali studenti a doktorandi. Tato pravidla se musela formulovat tak, aby bylo jisté, že program bude schopen poznat chybu. Uvedu příklad rozpoznání a zpracování pravopisné chyby: pokud máme ve větě spojovací výraz „proto“ a nebude před ním čárka, tak korektor vyhodnotí, že před „proto“ se čárka má psát vždy, a označí chybu.
Jelikož má Opravilo sloužit veřejnosti, jaká je cílová skupina uživatelů? Myslíte si, že jste tímto projektem schopni oslovit široké spektrum uživatelů?
DH: Nebylo úplně jednoduché definovat cílovou skupinu, protože jsme si pořád říkali, že to mohou používat všichni, kteří píšou česky. V rámci zjišťování předběžného zájmu jsme oslovovali i některé vytipované skupiny, například překladatele, novináře, studenty, učitele nebo zaměstnance firem, kteří hodně komunikují prostřednictvím e-mailů a nejsou si jistí pravopisem. Předpokládáme, že ve firmách nebo na úřadech může být Opravidlo velmi žádané.
Jakou formou jste zájem o korektor zjišťovali?
DH: Ještě před začátkem projektu jsme rozeslali dotazník. Kromě mapování zájmu nám vyplněné dotazníky přinesly podněty pro přidání funkcí, které nás na začátku nenapadly. Například aby se neměnil formát již zformátovaného textu nebo aby byla doplněna diakritika, pokud bude někdo psát bez ní. I během testování Opravidla nám uživatelé mohli posílat informace o chybách nebo podněty na zapracování změn.
HŽ: Ze zpětné vazby jsme se třeba dozvěděli, že uživatelé požadují přidání funkce zobrazení počtu chyb v celém vloženém textu, což už dnes standardně funguje.
Můžeme Opravidlo označit za jakousi obdobu Grammarly.com?
DH: Náš původní vizuální návrh byl červenobílý, ale upustili jsme od něj, protože působil příliš „agresivně“, a změnili ho na zelenobílý. Grammarly.com bylo pro nás na začátku inspirací, ovšem angličtina a čeština jsou dva zcela odlišné jazyky, a proto vyžadují odlišné přístupy.
Existují na internetu i jiné korektory, které mohou naopak konkurovat Opravidlu?
DH: Pro nás byl největším konkurentem, kterého jsme chtěli překonat, korektor z aplikace Microsoft Word. Opravidlo toho umí víc, a k tomu je v aktuální verzi veřejnosti dostupné zdarma. Bezplatnost byla jedna z častých požadavků uživatelů v dotazníkovém průzkumu.
Pracuje Ústav českého jazyka FF MU kromě Opravidla na dalších projektech, které bude moci využívat široká veřejnost?
DH: V nedávné době jsme pracovali ještě na jednom projektu, který už je doko
nčený. Výsledkem byla mobilní aplikace CzechME pro výuku českého jazyka pro cizince. Výchozím jazykem pro učení češtiny je angličtina. Za podpory Masarykovy univerzity byla vytvořena ještě ukrajinská verze. Aktuálně se připravuje verze, která bude ve švédštině. A není vyloučeno, že se v budoucnosti dočkáme verzí v dalších jazycích.
Zdroj: portál Filozofické fakulty MU, autor: Filip Krčmař
Foto: Evgeniia Tokmakova