MS Office 2003 - Kontrola české gramatiky
22. 7. 2005 07:00 Rubrika: Ostatní Autor: Martin Janouch
Kontrola české gramatiky byla vždy velice obtížná a její automatizace takřka nemožná. Na trhu se objevilo několik komerčních nástrojů snažících se tuto kontrolu s většími či menšími úspěchy provádět. Nyní přišel sám Microsoft se svým nástrojem a my se na něj pořádně podíváme.
Vývoj tohoto nástroje trval celých pět let a podílel se na něm Ústav pro jazyk český Akademie věd České republiky zároveň s odborníky z Univerzity Karlovy. Poslední fázi vývoje, tedy programování a začlenění nástroje do MS Wordu a operačního systému měla na starosti firma MorphoLogic. Nástroj byl vyvíjen tak dlouho nejen kvůli složitosti kontroly češtiny, ale také díky tomu, že první potenciální partner nedokázal plnit požadavky Microsoftu, hlavně co se týče spolehlivosti detekování chyb a hlášení falešných poplachů.
Tuto první verzi určenou pro MS Office 2003 si mohou uživatelé stáhnout zdarma ze stránek společnosti Microsoft, nové MS Office ji již budou mít implementovánu standardně. Dle prvních zpráv měla být možnost stažení tohoto produktu zdarma podmíněna ověřením legálnosti sady MS Office, ovšem nakonec Microsoft od tohoto ustoupil.
Kontrola české gramatiky nepracuje na bázi umělé inteligence, nesnaží se tedy pochopit smysl věty. Její hlavní prioritou je kontrola gramatiky a v malé míře také stylu (upozorňuje například na velice dlouhé věty atd.). Obsahuje kolem tisíce gramatických pravidel a jejím největším problémem je homonymie češtiny. Pracuje ve čtyřech hlavních krocích. Prvním z nich je rozčlenění celého textu na jednotlivé věty. Následuje analýza správnosti dané věty a poté vyhledání a ohlášení případné chyby. Nakonec je navržena nejvhodnější oprava. Kontrolor je nastaven tak, aby spíše chybu vynechal, než aby indikoval chybu tam, kde ve skutečnosti není.
Pracujete-li s textovým editorem MS Word, jistě víte, že již nabízí jeden doplněk, označovaný jako Kontrola českého pravopisu. Ten ovšem dokáže opravit pouze překlepy v rámci jednoho slova. Instalací Kontroly české gramatiky zůstává tento doplněk stále funkční a vám se tak při psaní v textu podtrhávají červeně slova obsahující pravopisnou chybu a zeleně části vět s chybou gramatickou.
Kontrola gramatiky se používá běžně, jak jste zvyklý i z kontroly pravopisu. V otevřeném dokumentu Wordu vyberete český text, který chcete zkontrolovat. Poté v nabídce Nástroje vyberete příkaz Jazyk a v něm další Nastavit jazyk. V seznamu vyberete češtinu a pak pomocí funkční klávesy F7, nebo přes menu Nástroje/Pravopis aktivujte kontrolu pravopisu. Spustíte-li potom pomocníka Office, vysvětlí vám gramatické chyby v textu. V menu Nástroje/Možnosti/Pravopis si také můžete navolit automatickou kontrolu gramatiky.
Kontrolu české gramatiky jsem sám vyzkoušel na několika českých textech. Ve všech se kontrole podařilo správně odhalit zhruba 40 - 50% chyb. Počet falešných chyb se pohyboval okolo 7 - 10% vztaženo k celkovému počtu chyb v textu. Při porovnání s největším a snad i jediným pořádným konkurentem, komerčním Grammaticonem od firmy Lingea, dopadl nástroj Microsoftu velice dobře. Zatímco v počtu správně rozpoznaných chyb je Grammaticon pozadu jen o pár procent, v počtu falešných poplachů je mezi oběma nástroji rozdíl až propastných 30% ve prospěch Microsoftu.
Po dlouhých letech čekání se nám dostává do rukou kvalitní nástroj na kontrolu české gramatiky. Jeho dalším kladem, kromě slušné spolehlivosti odhalování gramatických a částečně i stylistických chyb, je to, že majitelům sady MS Office 2003 je nabízen ke stažení zdarma bez nutnosti dalšího příplatku.