Перейти к содержанию

Синтаксический анализатор


Рекомендуемые сообщения

Опубликовано

Добрый вечер, необходимо сделать синтаксический анализатор.

Суть такова: имеется предложение, для каждого слова известны его морфологические признаки(часть речи, падеж, род, число, лицо). Нужно провести синтаксический анализ и построить граф зависимости для этого предложения.

Может у кого есть идеи как это можно сделать?

Опубликовано

Да продолжение.

Вообще он называется графом зависимостей, но можно сказать что это дерево. Нужно что-то типа в treeView или в еще где-нибудь(это не очень важно) выводить структуру, 1-ый уровень сказуемое, 2-ой уровень - подлежащее, 3-ий - зависимое слово и т.д.

На третьем уровне могут быть несколько слов.

Вот нашел пример.

%D0%BE%D0%B1%D0%B5%D1%81%D0%BF%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5.PNG

Только мне не нужен, мне нужна идея.

Опубликовано

ну это понятно.

а если сложное предложение? наверно корень лучше использовать заглушку. а от нее уже плясать.

в чем у вас проблема? определить кто к чему относится?

зы дерево, по проще скажем, граф не имеющий циклических связей.

ну судя по вики вы говорите о дереве.

Только мне не нужен, мне нужна идея.

есть какие либо упрощающие ограничения или wild world.

Опубликовано

1. Что то не понял. Какая заглушка? ЧТо это?

2. Да, как определить что к чему относится.

Допустим в предложении есть слово "слово" - морф инф-ция: 1 вариант: сущ, ед.ч, им.п.;2 вариант: сущ, вин.ч, им.п.

Возможно в этом случае выбор будет делаться из того, есть ли еще в данном предложении сущ. или местимения в имен.падеже. Опять же если есть такое слово, то где гарантия, что его можно воспринимать тоолько в им. падеже?

Может нужно создать файл, в котором будут прописаны все соответствия между словами, то есть как сущ. соотноситься с прилаг.?

3. Ограничений нет. wild world. только если взять за ограничение словарь.

Опубликовано
2. Да, как определить что к чему относится.

правила русского языка.

иначе никак.

Допустим в предложении есть

так и рассматривают предложение , слово в контексте, а не отдельно.

если же есть варианты в отношение отдельного слова, то проверка вариантов на зависимых приведет к правильному выбору гипотезы.

Может нужно создать файл,

"базу" знаний для программы конечно создавать необходимо. иначе никак.

Опубликовано

buterforever, Серега? )))))

а мы ждем твой синтаксический анализатор, чтобы доделать переводчик =Р чувствую мы его не скоро получим? ))))

по теме: большие проблемы возникнут с местоимениями, т.к. о них информации никакой (морфологический анализатор не поддерживает).

к примеру, мы ждем твой синтаксический анализатор.

Информация из морф.анализатора:

мы - местоимение
ждем - глагол, мн.ч., 1 лицо.
твой - местоимение
синтаксический - прилагательное (1.ед.ч, м.р, им.п. / 2.ед.ч, м.р, вин.п.)
анализатор - сущ. (1.ед.ч, муж.р, им.п. / 2.ед.ч, муж.р, вин.п.).

вот из этого надо построить дерево.

Опубликовано

buterforever, было бы отлично, если бы это поддерживалось. т.к. в используемом нами анализаторе, этого нет. Не говоря уже о таких частях речи как наречие, причастие, деепричастие.

Опубликовано

0xDEADBEEF, товарищь buterforever занимается русским.

мы занимаемся переводом, у нас как такого анализатора нет, у нас будут правила построения предложений на английском.

Опубликовано

coder, у кого то морфологический анализатор был дипломной работой, насчет синтаксического не знаю. наш переводчик - лишь допуск до экзамена =\

Опубликовано

TolkienDRR

нормуль. наконец то прекратили квадратики и линеечки задавать

http://lemmatizer.org/ru/

Добавлено спустя 1 минуту 10 секунд:

наш переводчик -

и какой критерий будет при сдаче проекта ?

Опубликовано

coder, пока у нас несложный текст на 1.5 страницы А4 на русском. "Терпимый" перевод на английский язык, с правильным построением фраз.

Морфологический анализатор русского языка используем чужой, а синтаксическим (тоже русского языка) видимо buterforever занимается.

Опубликовано

а что меня искать :) я тута

Добавлено спустя 1 минуту 31 секунду:

могу подсказать - представление графа в табличной форме более удобное и правильное ;)

Опубликовано

CooDi, что ж так долго молчал то xD

buterforever, думаю имелось ввиду (для примера, Программное обеспечение вычислительной техники автоматизированных систем):

te.jpg

Опубликовано

TolkienDRR

аха.

Добавлено спустя 21 минуту 1 секунду:

обратите внимание на то, что слово может зависеть только от одного слова, не больше.

Опубликовано
обратите внимание на то, что слово может зависеть только от одного слова, не больше.
но может быть меньше. корень дерева... но тут больше проблема возникает не в представлении дерева, а в правилах его построения.
Опубликовано

TolkienDRR

но тут больше проблема возникает не в представлении дерева, а в правилах его построения.

В этом-то в принципе и есть суть данной ветки.

Пожалуйста, войдите, чтобы комментировать

Вы сможете оставить комментарий после входа в



Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...