Перейти к содержанию

Синтаксический анализатор


Рекомендуемые сообщения

Добрый вечер, необходимо сделать синтаксический анализатор.

Суть такова: имеется предложение, для каждого слова известны его морфологические признаки(часть речи, падеж, род, число, лицо). Нужно провести синтаксический анализ и построить граф зависимости для этого предложения.

Может у кого есть идеи как это можно сделать?

Ссылка на комментарий

Да продолжение.

Вообще он называется графом зависимостей, но можно сказать что это дерево. Нужно что-то типа в treeView или в еще где-нибудь(это не очень важно) выводить структуру, 1-ый уровень сказуемое, 2-ой уровень - подлежащее, 3-ий - зависимое слово и т.д.

На третьем уровне могут быть несколько слов.

Вот нашел пример.

%D0%BE%D0%B1%D0%B5%D1%81%D0%BF%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5.PNG

Только мне не нужен, мне нужна идея.

Ссылка на комментарий

ну это понятно.

а если сложное предложение? наверно корень лучше использовать заглушку. а от нее уже плясать.

в чем у вас проблема? определить кто к чему относится?

зы дерево, по проще скажем, граф не имеющий циклических связей.

ну судя по вики вы говорите о дереве.

Только мне не нужен, мне нужна идея.

есть какие либо упрощающие ограничения или wild world.

Ссылка на комментарий

1. Что то не понял. Какая заглушка? ЧТо это?

2. Да, как определить что к чему относится.

Допустим в предложении есть слово "слово" - морф инф-ция: 1 вариант: сущ, ед.ч, им.п.;2 вариант: сущ, вин.ч, им.п.

Возможно в этом случае выбор будет делаться из того, есть ли еще в данном предложении сущ. или местимения в имен.падеже. Опять же если есть такое слово, то где гарантия, что его можно воспринимать тоолько в им. падеже?

Может нужно создать файл, в котором будут прописаны все соответствия между словами, то есть как сущ. соотноситься с прилаг.?

3. Ограничений нет. wild world. только если взять за ограничение словарь.

Ссылка на комментарий
2. Да, как определить что к чему относится.

правила русского языка.

иначе никак.

Допустим в предложении есть

так и рассматривают предложение , слово в контексте, а не отдельно.

если же есть варианты в отношение отдельного слова, то проверка вариантов на зависимых приведет к правильному выбору гипотезы.

Может нужно создать файл,

"базу" знаний для программы конечно создавать необходимо. иначе никак.

Ссылка на комментарий

buterforever, Серега? )))))

а мы ждем твой синтаксический анализатор, чтобы доделать переводчик =Р чувствую мы его не скоро получим? ))))

по теме: большие проблемы возникнут с местоимениями, т.к. о них информации никакой (морфологический анализатор не поддерживает).

к примеру, мы ждем твой синтаксический анализатор.

Информация из морф.анализатора:

мы - местоимение
ждем - глагол, мн.ч., 1 лицо.
твой - местоимение
синтаксический - прилагательное (1.ед.ч, м.р, им.п. / 2.ед.ч, м.р, вин.п.)
анализатор - сущ. (1.ед.ч, муж.р, им.п. / 2.ед.ч, муж.р, вин.п.).

вот из этого надо построить дерево.

Ссылка на комментарий

buterforever, было бы отлично, если бы это поддерживалось. т.к. в используемом нами анализаторе, этого нет. Не говоря уже о таких частях речи как наречие, причастие, деепричастие.

Ссылка на комментарий

0xDEADBEEF, товарищь buterforever занимается русским.

мы занимаемся переводом, у нас как такого анализатора нет, у нас будут правила построения предложений на английском.

Ссылка на комментарий

coder, у кого то морфологический анализатор был дипломной работой, насчет синтаксического не знаю. наш переводчик - лишь допуск до экзамена =\

Ссылка на комментарий

TolkienDRR

нормуль. наконец то прекратили квадратики и линеечки задавать

http://lemmatizer.org/ru/

Добавлено спустя 1 минуту 10 секунд:

наш переводчик -

и какой критерий будет при сдаче проекта ?

Ссылка на комментарий

coder, пока у нас несложный текст на 1.5 страницы А4 на русском. "Терпимый" перевод на английский язык, с правильным построением фраз.

Морфологический анализатор русского языка используем чужой, а синтаксическим (тоже русского языка) видимо buterforever занимается.

Ссылка на комментарий

а что меня искать :) я тута

Добавлено спустя 1 минуту 31 секунду:

могу подсказать - представление графа в табличной форме более удобное и правильное ;)

Ссылка на комментарий

CooDi, что ж так долго молчал то xD

buterforever, думаю имелось ввиду (для примера, Программное обеспечение вычислительной техники автоматизированных систем):

te.jpg

Ссылка на комментарий
обратите внимание на то, что слово может зависеть только от одного слова, не больше.
но может быть меньше. корень дерева... но тут больше проблема возникает не в представлении дерева, а в правилах его построения.
Ссылка на комментарий

TolkienDRR

но тут больше проблема возникает не в представлении дерева, а в правилах его построения.

В этом-то в принципе и есть суть данной ветки.

Ссылка на комментарий

Пожалуйста, войдите, чтобы комментировать

Вы сможете оставить комментарий после входа в



Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...