#157: Распознавание образов

« картинки и свежие анекдоты | чат

#157: Распознавание образов

Велик и могуч Русский Язык!

А все началось с простой задачи: принять на входе строку, введенную пользователем, и найти информацию в БД по ключевым словам.
Будь это какой-нибудь английский - задача решается в два счета.

Но ведь у нас как всегда все иначе, у нас есть падежи, склонения, спряжения, окончания, рода, а поэтому простое слово "трансклюкатор" может иметь множество форм, включая "трансклюкаторное оборудование".

Вспомнив уроки русского языка в школе - набросал табличку с падежами, табличку с окончаниями, и сел заполнять табличку с корнями, подставляя к словам подходящие варианты. Получилось долго и трудно.

Надоело. Написал скрипт, который анализирует слово, сам подбирает подходящие варианты на выбор - остается только выбрать из нескольких.
Стало легче, но все равно работы много.

Подумалось: а откуда Я знаю, как правильно? Видел-читал-запомнил, так?
Написал скрипт, который вводит слова, подбирает варианты, если вариантов несколько - записывает слово в отдельную табличку. Когда там накопятся несколько форм - выбор вариантов сужается, и так до тех пор. пока непонятых слов не останется.

Осталось только слов побольше туда набить. Посадил ЭТО на сервер, читать книги из библиотеки Мошкова. Пусть набирается ума-разума.

Чувствую, следующим шагом научу его пользоваться Гуглом...

Комментарий:

Ваше имя:

Ещё интересное на этом сайте:

Игры
мост в никуда
Кому Вандервуда по дешевке?
Про недоделанных хакеров и соц. инжиниринг
Анекдоты и картинки #23504
Анекдоты и картинки #23503
Анекдоты и картинки #23502
Pre-election erection collection
Самое главное в жизни
Интересное в сети
Водородный квадроцикл Quark – фантастика и реальность!
Девушки "Игромира 2008"
продается 100 миллиардов
Анекдоты и картинки #23495
Анекдоты и картинки #23494
Анекдоты и картинки #23493
Анекдоты и картинки #23492
Анекдоты и картинки #23491
Анекдоты и картинки #23490
Анекдоты и картинки #23489
« все анекдоты и картинки
Рейтинг@Mail.ru