Перейти к содержанию

Синтаксический анализатор


Рекомендуемые сообщения

Опубликовано

Добрый вечер, необходимо сделать синтаксический анализатор.

Суть такова: имеется предложение, для каждого слова известны его морфологические признаки(часть речи, падеж, род, число, лицо). Нужно провести синтаксический анализ и построить граф зависимости для этого предложения.

Может у кого есть идеи как это можно сделать?

Опубликовано

Да продолжение.

Вообще он называется графом зависимостей, но можно сказать что это дерево. Нужно что-то типа в treeView или в еще где-нибудь(это не очень важно) выводить структуру, 1-ый уровень сказуемое, 2-ой уровень - подлежащее, 3-ий - зависимое слово и т.д.

На третьем уровне могут быть несколько слов.

Вот нашел пример.

%D0%BE%D0%B1%D0%B5%D1%81%D0%BF%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5.PNG

Только мне не нужен, мне нужна идея.

Опубликовано

ну это понятно.

а если сложное предложение? наверно корень лучше использовать заглушку. а от нее уже плясать.

в чем у вас проблема? определить кто к чему относится?

зы дерево, по проще скажем, граф не имеющий циклических связей.

ну судя по вики вы говорите о дереве.

Только мне не нужен, мне нужна идея.

есть какие либо упрощающие ограничения или wild world.

Опубликовано

1. Что то не понял. Какая заглушка? ЧТо это?

2. Да, как определить что к чему относится.

Допустим в предложении есть слово "слово" - морф инф-ция: 1 вариант: сущ, ед.ч, им.п.;2 вариант: сущ, вин.ч, им.п.

Возможно в этом случае выбор будет делаться из того, есть ли еще в данном предложении сущ. или местимения в имен.падеже. Опять же если есть такое слово, то где гарантия, что его можно воспринимать тоолько в им. падеже?

Может нужно создать файл, в котором будут прописаны все соответствия между словами, то есть как сущ. соотноситься с прилаг.?

3. Ограничений нет. wild world. только если взять за ограничение словарь.

Опубликовано
2. Да, как определить что к чему относится.

правила русского языка.

иначе никак.

Допустим в предложении есть

так и рассматривают предложение , слово в контексте, а не отдельно.

если же есть варианты в отношение отдельного слова, то проверка вариантов на зависимых приведет к правильному выбору гипотезы.

Может нужно создать файл,

"базу" знаний для программы конечно создавать необходимо. иначе никак.

Опубликовано

buterforever, Серега? )))))

а мы ждем твой синтаксический анализатор, чтобы доделать переводчик =Р чувствую мы его не скоро получим? ))))

по теме: большие проблемы возникнут с местоимениями, т.к. о них информации никакой (морфологический анализатор не поддерживает).

к примеру, мы ждем твой синтаксический анализатор.

Информация из морф.анализатора:

мы - местоимение
ждем - глагол, мн.ч., 1 лицо.
твой - местоимение
синтаксический - прилагательное (1.ед.ч, м.р, им.п. / 2.ед.ч, м.р, вин.п.)
анализатор - сущ. (1.ед.ч, муж.р, им.п. / 2.ед.ч, муж.р, вин.п.).

вот из этого надо построить дерево.

Опубликовано

buterforever, было бы отлично, если бы это поддерживалось. т.к. в используемом нами анализаторе, этого нет. Не говоря уже о таких частях речи как наречие, причастие, деепричастие.

Опубликовано

0xDEADBEEF, товарищь buterforever занимается русским.

мы занимаемся переводом, у нас как такого анализатора нет, у нас будут правила построения предложений на английском.

Опубликовано

TolkienDRR

нормуль. наконец то прекратили квадратики и линеечки задавать

http://lemmatizer.org/ru/

Добавлено спустя 1 минуту 10 секунд:

наш переводчик -

и какой критерий будет при сдаче проекта ?

Опубликовано

coder, пока у нас несложный текст на 1.5 страницы А4 на русском. "Терпимый" перевод на английский язык, с правильным построением фраз.

Морфологический анализатор русского языка используем чужой, а синтаксическим (тоже русского языка) видимо buterforever занимается.

Опубликовано
обратите внимание на то, что слово может зависеть только от одного слова, не больше.
но может быть меньше. корень дерева... но тут больше проблема возникает не в представлении дерева, а в правилах его построения.

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...