Домой / Поисковые системы / siteMETA — украинская система для поиска по сайтам

siteMETA — украинская система для поиска по сайтам

Харьковская компания МЕТА, известная своей одноименной поисковой системой http://meta.ua/ разработала поисковую систему для сайтов siteMETA.

Как утверждают разработчики, целью работ было создание продукта, который бы позволял организовать качественный полнотекстовый поиск по веб-серверу, был бы прост в установке и эксплуатации, нетребователен к системным ресурсам и доступен по цене. В siteMETA процесс построения индекса организован таким образом, что сразу с начала индексации возможен поиск по уже проиндексированным документам. При обновлении сайта siteMETA сама найдет новые документы на сайте и добавит их в индекс.

Для некоммерческих проектов предусмотрена облегченная бесплатная версия siteMETA, позволяющая индексировать до 11 Мб документов. Коммерческая версия имеет расширенные возможности и позволяет не только индексировать большие объемы информации, но и подключать модули расширения — поддержку дополнительных форматов файлов, лингвистическую поддержку.

Качество поиска обеспечивается алгоритмами работы с координатным индексом, позволяющими учитывать не только такие простые факторы, как количество вхождений искомого слова в документе, но и значимость этого слова в рамках множества документов сайта, близость и порядок слов, форматирование документов и ряд других характеристик.

Система siteMETA способна обрабатывать документы на любом из европейских языков, поддерживает морфологию русского, украинского и английского языков, корректно работает со спецсимволами. Кроме этого, специальные модули лингвистической поддержки позволяют находить различные формы неологизмов, фамилий и имен собственных.

Дополнительные фильтры форматов позволят использовать поиск не только по html-документам, но и по документам наиболее популярных «офисных» форматов. Например, при помощи этих фильтров можно организовать простую корпоративную поисковую систему на внутреннем веб-сайте. В настоящее время к siteMETA можно подключить фильтры для Microsoft Word, Microsoft Excel, RTF, XML, txt.

Более подробная информация о разработке изложена на сайте программы для поиска по сайту siteMETA — sitemeta.com

На вопросы Рунет.Ру отвечает Алексей Чуксин, один из руководителей компании МЕТА.

— Алексей, на кого рассчитан продукт?

— Проект рассчитан на владельцев вебсерверов, либо на пользователей на хостинге, имеющих права администратора на сервере хостинг-провайдера.

— Что вы считаете главной технологической изюминкой системы?

— Главная технологическая изюминка — так называемый «динамический индекс». Обычно процесс индексации и поиска разнесен во времени. Для обновления индекса необходимо сначала проиндексировать сайт, а потом заменить старый индекс новым, либо добавить изменения к уже существующему индексу. И только потом по нему можно искать.

В siteMETA процесс построения индекса организован таким образом, что сразу с начала индексации возможен поиск по уже проиндексированным документам. Никаких специальных операций с индексом производить не надо. siteMETA сама найдет новые документы на сайте и добавит их в индекс. Если сайт обновился, новые документы попадут в индекс без вмешательства вебмастера.

Ну и плюс к этому, «джентльменский набор» современной поисковой системы — координатный индекс, учет близости слов и форматирования документа при определении релевантности, корректная работа со всеми европейскими языками, поддержка морфологии для русского, украинского, английского языков, бессловарная морфология для имен собственных, неологизмов, сокращений, обработка спецсимволов, подключение дополнительных форматов документов.

— Если проект рассчитан на самую широкую аудиторию, то кого вы считаете главными конкурентами в Рунете?

— Главные конкуренты в Рунете — уже известные разработки Яndex.Site и mnoGoSearch. Система siteMETA разрабатывалась с учетом критических замечаний, высказываемых вебмастерами к этим продуктам. Так, например, мы уделили максимальное внимание простоте установки и настройки поиска по сайту.

После установки и настройки программа практически не требует внимания к себе. Если сравнивать с mnoGoSearch, то у нас значительно лучше качество поиска. При ранжировании документов мы учитываем множество факторов, которые не учитываются mnoGoSearch, — близость слов в документе, место слова в документе, вес слова во всем пространстве сайта, влияние элементов форматирования документа и т.п. Кроме этого, к siteMETA могут быть подключены модули словарной и бессловарной морфологии.

Еще для поиска с помощью mnoGoSearch на сервере необходимо иметь какую-либо базу данных. Для работы siteMETA внешние базы данных не нужны.

Если сравнивать качество поиска с Яndex.Site, то здесь примерно похожая картина, так как при определении порядка ранжирования документов учитываются сходные параметры.

Однако наша программа значительно проще в установке и администрировании. Кроме этого, мы предлагаем дополнительные фильтры для различных форматов документов.

— А что скажете о ценовой конкуренции?

— «Яндекс» предлагает бесплатную облегченную версию до 5 Мб. Самая дешевая коммерческая версия стоит 395 долларов. При этом условием установки программы является ссылка на «Яндекс», что справедливо не нравится многим коммерческим сайтам.

В то же время, mnoGoSearch предлагает бесплатную версию для некоммерческого использования в странах СНГ. Коммерческая версия стоит 799 у.е., облегченная — 100 у.е. Мы предлагаем дифференцированную политику цен. Для некоммерческих сайтов — бесплатная версия на 11 Мб текстов. Для коммерческих сайтов цена зависит от объема индексируемых документов и начинается с 20 у.е. Если у сайта возникнет необходимость индексировать больший объем документов, то лицензия на дополнительный объем, будет значительно дешевле, чем первая покупка.

— Существует ли индивидуальный подход к каждому заказчику?

— siteMETA — это продукт для владельцев сайтов. Он поставляется в готовом виде в конфигурации, затребованной заказчиком. В конфигурацию входит: объем индексируемых документов, дополнительные модули лингвистической поддержки для необходимых языков, дополнительные модули форматов фильтров.

Если у заказчика какие-то особые требования к поиску, например поиск по специализированной базе данных, поддержка особых форматов документов или языков, интеграция поиска в собственный программный продукт, то в таких случаях мы работаем индивидуально с каждым заказчиком и предлагаем решение, необходимое именно ему. Естественно цена при этом складывается из необходимых трудозатрат.

08.08.2002 автор: Виктор ЗахарченкоРунет.Ру

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *