Реклама в Интернет   Все Кулички
  abs.kulichki.com:
> Форум
> Юмор
> Анекдоты
> Игры онлайн
> Тесты онлайн
  > Онлайн судоку
> Онлайн кроссворды
> Кроссворды в архиве
> Японские кроссворды
> Викторина с призами
Абсолютно Бесполезный Сайт   Судоку на сайте 26520
Японских кроссвордов 548
Классических кроссвордов 7114
Сегодня 19 мая 2024 г., воскресенье
АБС.txt

Начало
Главное
В мире
Комментарии
Наука
Hi-tech
Курьёзы
Автомобили
Здоровье
Спорт
Культура
Про ЭТО
Праздники

Весь АБС




Запущена новая интеллектуальная поисковая система Nigma.ru

14 апреля 2005    18:28

Интеллектуальная поисковая система Nigma.ru - результат работы научного коллектива, состоящего из студентов и аспирантов факультетов ВМиК и психологии МГУ им.М.В.Ломоносова - официально запущена в статусе альфа-версии (т.е. самой ранней версии). Несмотря на то, что работы над поисковой системой продолжаются лишь 2.5 месяца, членами команды уже разработаны оригинальные алгоритмы ранжирования результатов, полученных от набора поисковых систем, с поддержкой русской морфологии и двухуровневая кластеризация.

Морфология реализована через отсылку в поисковые системы дублирующих запросов, в которых приведены все распространенные морфологические формы запрашиваемых слов. При этом, в отличие от имеющихся реализаций русской морфологии для поисковых систем, предлагаемый алгоритм не сокращает, а наоборот - увеличивает количество найденных документов, т.к. морфологически измененный запрос объединяется с исходным. Релевантность же также увеличивается (см. запрос «почта»), т.к. используются специальные алгоритмы объединения результатов. Позиция найденной ссылки в результатах поиска отображается в виде «Поисковая система: позиция» (например, “Google: 5” означает, что ссылка находится на пятом месте в поисковой системе Google), а ссылки от морфологически измененных запросов - в виде «Поисковая система-M: позиция» (например, “Google-M: 10” - десятая ссылка в морфологически измененном запросе).

Результаты поиска объединяются с помощью специального алгоритма, причем только те результаты, которые Nigma.ru успевает получить от поисковых систем за 1.5 секунды (в очень редких случаях - за 5 секунд). Соответственно, алгоритм не выделяет какие-то поисковые системы таким образом, что результаты поиска от них имеют большую значимость, чем от других, т.к. нет гарантии, что за это время система успеет обработать от них результаты. Вместо этого, для их объединения используется статистическая информация о русском Интернете, такая как посещаемость (на базе публичных счетчиков) и цитируемость сайтов. Кроме того, учитываются другие специфичные для российского Интернета и русского языка особенности при объединении результатов.

В итоге, на подавляющее большинство поисковых запросов Nigma.ru выдает на порядок больше найденных сайтов, чем, например, при простом поиске на сайте Google.ru. Для того чтобы пользователь не запутался в этих результатах, они группируются в так называемые «кластеры». Каждый кластер - это группа сайтов, относящихся, по мнению поисковой системы, к общей тематике. Научная группа решила использовать частотную кластеризацию по ключевым словам, поэтому названия кластеров - это тоже ключевые слова, которые пользователь может использовать для расширения своего запроса. В свою очередь, т.к. количество найденных кластеров также зачастую очень велико, интеллектуальный алгоритм объединяет кластеры в иерархию (пока - двухуровневую), которая позволяет представить их в более компактном виде. Например, введя очень общий запрос «новости», на который поисковая система Nigma.ru выдает порядка полумиллиарда документов, в левой колонке вы видите самые популярные темы новостей, которые встречаются в Интернете. Нажав на тему (например, «спорт»), вы получите примеры новостных ресурсов, которые освещают эту тему. Если вы хотите получить больше ресурсов о новостях спорта, нужно нажать на «Расширить запрос» - тогда система выдаст более двух миллионов ссылок о новостях спорта. Они, в свою очередь, тоже отклассифицированы по темам - есть футбол, хоккей и т.п.

Работа научной группы в части кластеризующих алгоритмов находится в начальной стадии, и ее участники планируют продолжать ее совершенствование. В ближайшее время поисковая система будет расширена экспертными системами, психологическими тестами, системами поведенческого анализа, и другими методами, базирующимися на таких алгоритмах искусственного интеллекта как искусственные нейронные сети, генетические алгоритмы, алгоритмы нечеткой логики и т.п. Исследования группы имеют научный характер, поэтому, после того как будет создана стабильная версия кода, планируется опубликовать его исходные тексты.

Дмитрий Гришин, генеральный директор Mail.ru: “Нам интересно поддерживать этот научный проект, т.к. мы считаем, что развитие поисковых технологий будет способствовать развитию всего российского сегмента сети Интернет. Обмен научным опытом позволит нам совершенствовать наши коммерческие технологии, функционирующие в рамках портала Mail.ru”.

Сергей Петренко, Searchengines.ru: “Nigma.ru - очень оригинальный проект, который даже на такой ранней стадии своего развития уже включает интересные технологии, сочетающие искусственный интеллект и классические методы поиска в Интернете. Участникам команды еще многое предстоит сделать, чтобы довести его до уровня своих коммерческих аналогов, но уже сейчас он может быть использован новичками, которым трудно формулировать запросы для обычных поисковых систем. Система кластеризации сделана прекрасно и способна серьезно помочь пользователю ориентироваться в тех значительных объемах информации, которые Nigma.ru выдает на запросы пользователей общего характера”.

Мария Черницкая, iContext: “По большей части все мы пользуемся Интернетом для поиска информации. Чем короче путь от поискового запроса до получения того, что ищешь, тем, понятное дело, всем лучше. И чем больше исследований и разработок в этой области, тем больше выигрывает конечный пользователь. Искать обычной поисковой системой мы уже все более менее научились, привычки же пользоваться мета поиском и прибегать к кластеризованным результатам для получения более релевантного результата в короткий срок, такой привычки пока нет. И не потому что пользователи не продвинутые, а потому что ресурса, который бы позволял это, пока в русском Интернете не было. И вот появился – NIGMA.ru. Это означает, что появилась принципиальный иной способ искать и находить информацию”

Источник: SearchEngines

Ссылки по теме:
www.nigma.ru

Обсудить на форуме

ЧИТАЙТЕ ТАКЖЕ

Российские технологии в Ганновере опередили мир на поколение

Текст: Дмитрий ЛИТОВКИН
13 апреля 2005    21:45

Энергетика, авиа- и кораблестроение, новые материалы и программное обеспечение - главные фишки российской экспозиции на международной промышленной ярмарке в немецком Ганновере. 136 фирм из России демонстрируют свои последние достижения, которые давно и весьма успешно экспортируются. Часто у этих экспонатов нет аналогов.

- Россия производит впечатление, - пошутил как-то один из руководителей нашей страны. - Больше она ничего не производит.

Попав в российский павильон Ганноверской ярмарки, в это трудно поверить. Основная масса экспонатов - новейшие технологии.



Облысение можно лечить трансгенными соевыми бобами

13 апреля 2005    22:19

В Японии выведен генетически измененный сорт соевых бобов, которые стимулируют рост волос и предотвращают их потерю от химиотерапии. Если подтвердится безопасность нового продукта, то, чтобы спастись от облысения, нужно будет просто периодически есть эти бобы, сообщил сегодня глава исследовательской группы Университета Киото профессор Массаки Иосикава.



Демократы не объединятся. Объединится оппозиция

Текст: Юлия ЛАТЫНИНА
13 апреля 2005    22:56

Возможно ли объединение демократов в России?
Нет.
Возможно ли объединение оппозиции?
Да.
Просто оппозиция будет объединяться не по принципу «демократ - не демократ», а по принципу «ты за Путина - или против?».




Дата рождения Даниила Гранина

1 января
14 февраля
9 мая
1 сентября

Увлекательная викторина с ежедневными денежными призами

> Об онлайн викторине: правила, призы
> Победителя викторины узнаём в 12.00 мск

Вчера лучший
не определён

Сегодня лучшие:
gvm50 91


Последние заголовки

11:27 15.03.2010
Перевод часов на летнее время — 27 марта 2011 г.
23:35 07.03.2010
Премия Оскар 2010
19:06 17.05.2009
Евровидение 2009
10:53 23.02.2009
Премия Оскар 2009
10:48 09.01.2009
День Святого Валентина
15:45 05.12.2008
Скончался патриарх Московский и всея Руси Алексий II
16:33 23.11.2008
12 декабря — день Конституции России
00:38 03.10.2008
В России начались продажи iPhone 3G
18:26 31.08.2008
В Назрани убит владелец сайта Ингушетия.ру Магомед Евлоев
01:10 30.08.2008
Суперкубок УЕФА 2008: Зенит - Манчестер Юнайтед 2:1
22:40 04.08.2008
Олимпийские игры 2008 в Пекине
13:33 04.08.2008
Скончался Александр Солженицын
01:06 03.07.2008
Рок-фестиваль Нашествие-2008
13:35 25.05.2008
Евровидение 2008
23:26 16.04.2008
Пасха 2008


abs.kulichki.com: Главная | Анекдоты | Юмор | Японские кроссворды онлайн | Сканворды | Онлайн судоку | Онлайн кроссворды | Архив кроссвордов | Гостевая книга | Форум | АБС.txt | Онлайн викторина | Онлайн игры | Психологические тесты онлайн | Ссылки