IBM pomáhá při vývoji softwaru pro analýzu obsahu

12. 12. 2006 17:45    Rubrika: Tiskové zprávy

IBM pomáhá při vývoji otevřeného, standardizovaného softwaru pro analýzu obsahu

TISKOVÁ ZPRÁVA – v původním znění

Společnost IBM oznámila dva zásadní kroky, které mají pomoci při otevřeném vývoji a standardizaci softwaru pro vyhledávání a analýzu obsahu.

Organizace OASIS (Organization for the Advancement of Structured Information Standards, Organizace pro rozvoj standardů strukturovaných informací) ustavila technický výbor, který má za úkol standardizovat specifikace Architektury pro správu nestrukturovaných informací UIMA (Unstructured Information Management Architecture). Dále nadace Apache Software Foundation založila inkubační projekt pro vývoj softwaru založeného na architektuře UIMA. Tato práce vychází z vývojového úsilí IBM v oblasti UIMA softwaru a také ze zkušeností IBM s implementacemi řešení analýzy obsahu u klientů a partnerů.

Podniky čím dál více závisí na schopnosti vyhledávat a analyzovat informace v různých formách a na různých místech. Mezi tyto informace mohou patřit poznámky z telefonního centra, ankety mezi zákazníky, patentové záznamy, e-maily, zvukové nahrávky, obrázky, video, položky blogu a zpravodajské kanály. Software pro analýzu obsahu umožňuje organizacím přesněji vyhledávat ty nejlepší informace a hloubkově analyzovat jejich kontext.

Technický výbor OASIS UIMA založili členové mezinárodního standardizačního konsorcia OASIS s cílem doladit a finalizovat soubor specifikací, které vycházejí z výchozího příspěvku IBM a podnětů DARPA, Univerzity Carnegie Mellon, Univerzity Columbia, Univerzity Stanford, Univerzity Massachusetts Amherst, MITRE Corporation a Science Applications International Corporation. Zakládajícími členy technického výboru jsou zástupci společností IBM, EMC, SRI International, Science Applications International Corporation, Temis, Thompson, Armádního ředitelství pro informační a zpravodajskou válku, Univerzity Sheffieldu a Univerzity Carnegie Mellon.

Nový inkubační projekt Apache odstartuje se zdrojovým kódem UIMA verze 2.0, který věnovala společnost IBM. Apache Software Foundation poskytuje podporu pro open source softwarové projekty charakterizované kolaborativním vývojovým procesem, který vychází z konsenzu účastníků, otevřenou, pragmatickou licencí na software a touhou vytvářet vysoce kvalitní software.

Kromě toho Institut jazykových technologií Univerzity Carnegie Mellon provozuje webový server UIMA Component Repository, kde mohou vývojáři vystavovat informace o svých analytických komponentách a kdokoli zde může vyhledávat bezplatné i komerční analytické nástroje, jež vyhovují specifikaci UIMA.

Mezi bezplatné analytické nástroje, které podporují specifikaci UIMA, patří nástroje komunit General Architecture for Text Engineering (GATE – http://gate.ac.uk/) a OpenNLP (http://opennlp.sourceforge.net/). Komerční analytické nástroje jsou k dispozici od IBM a dalších dodavatelů softwaru, například Attensity, ClearForest, Temis a Nstein.

Tiskové zprávy

Diskuse