ENIAMmorphology: analizator morfologiczny i guessser dla języka polskiego

Podaj słowo:



Opis programu

Dla zadanej formy program znajduje możliwe lematyzacje oraz interpretacje morfosyntaktyczne.
Wskazuje, które z nich znajdują się w SGJP w wersji z 2017.07.30.
Program analizuje słowa obce zaopatrzone w polskie końcówki fleksyjne, akronimy oraz niektóre formy gwarowe.

Program na wejściu otrzymuje pojedynczą formę.
Forma nie może być liczbą zapisaną za pomocą cyfr, znakiem interpunkcyjnym, ani inną sekwencją znaków
nie reprezentującą słowa za pomocą reguł ortograficznych.
Nie może ona posiadać aglutynatu, ani sufiksu trybu przypuszczającego.
Nie są analizowane również formy typu '2-gi'.

Na wyjściu generowana jest tabela, w której kolejnych wersach znajdują się możliwe interpretacje zadanej formy.
Kolejne kolumny tabeli zawierają:

Interpretacje, w których star=B są wysoce niejednoznaczne, ponieważ polegają na odgadnięciu obcej końcówki tematu, która nie jest widoczna w zadanej formie.
Atrybuty w ostatnim wersie tabeli są podawane po to, by umożliwić budowanie tagerów wykorzystujących cechy morfologiczne.

Do pobrania

Źródła:
Linux 64-bit:

Autor: Wojciech Jaworski, Szymon Rutkowski
Copyright © 2016-2018 Institute of Computer Science Polish Academy of Sciences

Parser wykorzystuje z następujące zasoby:
SGJP Copyright © 2007–2017 Zygmunt Saloni, Włodzimierz Gruszczyński, Marcin Woliński, Robert Wołosz, Danuta Skowrońska

W trosce o jakość generowanych lematyzacji zapytania użytkowników mogą być logowane.