С
ростом количества обрабатываемых данных организации испытывают
потребность в средствах поиска контента, интегрированных с
приложениями, в которых он создается. Использование подобных решений
должно улучшить протекание бизнес-процессов и повысить эффективность
деятельности сотрудников, работающих с информацией. Что предлагает
пользователям MS Office 2010?
Рынок средств корпоративного поиска преимущественно формировался на
Западе, где вопросы управления документацией и, в более широком смысле,
контентом стали актуальны еще в 1990-е годы. Основным стимулом к
созданию таких решений стал спрос на продукты, позволяющие управлять
данными, хранящимися в различных информационных системах, не связанных
между собой единым репозиторием. В 2000-х годах к обычным массивам
данных, состоящим из текстовых документов, стали прибавляться и
различные виды мультимедиа. Соответственно, возник спрос на решения,
которые могли бы повысить отдачу от имеющихся у компании информационных
активов, поскольку последние в данном случае помещались в единое
поисковое пространство. В этом отношении на первое место вышел
показатель эффективности самой системы управления контентом – с ростом
количества информации он начал снижаться, и исправить это положение
могли поисковые системы, которые предоставляли бы пользователям быстрый
результат поиска необходимой информации. Соответственно, вендоры стали
удовлетворять потребностям заказчиков с помощью собственных разработок.
В большой мере это было связано с осознанием вендорами того факта, что
без качественного поиска, без учета семантики конкретной предметной
области, без адекватных технологий классификации информации
преимущества хранения документов в электронном виде нивелируются.
Рассмотрим, какие поисковые технологии заложены в MS Office 2010.
Поиск в MS SharePoint
Корпорация Microsoft реализовала в MS Office 2010 сразу несколько
своих поисковых технологий. Целью их включения в продукт было
стремление повысить производительность труда бизнес-пользователей при
работе с КИС.
Движок FAST появился в MS SharePoint в версии 2010 года
По этой причине поиск вошел в шесть основополагающих аспектов новой концепции позиционирования MS SharePoint 2010.
Microsoft применяет в этом продукте сразу 5 движков, главными из
которых являются SharePoint Server 2010 Search и FAST Search Server
2010 for SharePoint (три других – подключаемый поиск Bing, поиск по
рабочим станциям с возможностями управления индексами и поиска по
зашифрованным разделам диска Windows Search 4.0 и федеративный поиск в
MS Windows 7/2008 Server R2). Первый представляет собой обновившееся
решение с базовыми возможностями, а второй – это отдельный провайдер,
интегрированный в версию 2010 года после покупки его разработчика
Microsoft в апреле 2008 года.
FAST Search Server 2010 for SharePoint предоставляет несколько
возможностей для бизнес-пользователей, которые не удовлетворены
стандартным поисковым механизмом MS SharePoint. Во-первых, следует
отметить возможность разработки и интеграции поиска с существующими
бизнес-приложениями за счет открытости фреймворка FAST Enterprise
Search Platform (ESP), а также упрощения взаимодействия с инструментами
управления MS SharePoint. Во-вторых, одна из поддерживаемых опций FAST
Search Server 2010 for SharePoint относится к управлению метаданными,
что улучшает поисковые результаты, позволяет достичь большей
релевантности при поиске за счет сужения области, например, до
определенных полей свойств документа. Отличительная черта данного
решения состоит в том, что оно автоматически извлекает любые значимые
метаданные из файлов, что позволяет быстро заполнить базу и повысить
результативность при работе с неструктурированным контентом. В-третьих,
и тот, и другой поисковой провайдер в версии 2010 года умеют искать
структурированное содержание, однако FAST Search Server 2010 for
SharePoint поддерживает дополнительные инструменты разработки для
работы с данными. В частности, к ним относится фирменный язык запросов
FAST Query Language (FQL), с помощью которого можно разрабатывать
приложения для связи корпоративного портала с другими сервисами и
приложениями (например, с Microsoft Business Connectivity Services).
В-четвертых, корпоративный поиск через FAST Search Server 2010 for
SharePoint поддерживает расширения, позволяющие проводить более
детальный и глубокий поиск информации независимо от объема контента.
Сергей Якимчук, руководитель центра
компетенции MS SharePoint компании Terralink: "Корпоративный поиск
является развивающимся рынком, но уже сейчас стало понятно, что
времена, когда в функция поиска требовала дополнительных действий от
пользователей, остались в прошлом. Современный пользователь требует,
чтобы корпоративный поиск был доступен в любом приложении, с которым он
работает, при этом он должен искать сразу во всех доступных
пользователю системах, а также позволять выполнять большинство функций
с найденными результатами непосредственно в том же приложении.
Microsoft движется в сторону создания поисковых приложений, меняющих
представление о способе работы пользователя с поисковой строкой и
результатом. На мой взгляд, именно поисковые технологии могут в
ближайшие годы привести к революционным изменениям как в работе
пользователей с их данными, так и на рынке ECM-систем".
Помимо сугубо внутренних улучшений, поиск в SharePoint на базе
технологии FAST визуализирует найденные результаты (предпросмотр
документов, изображений, презентаций и так далее). Одна из возможностей
поиска в SharePoint связана с настраиваемыми "лучшими" результатами
(функция "возможно, вы имели в виду"). Качество работы движка
улучшается также за счет продвинутых лингвистических инструментов,
которые в версии 2010 года получили поддержку нескольких мировых
языков. Кастомизация затрагивает также и функции персонального поиска -
в зависимости от пользовательского "контекста" (то есть того, что ищет
и планирует найти отдельный сотрудник или группа пользователей, а также
областей поиска, состоящих из предыдущих запросов, открытых страниц,
профилей) или профиля деятельности (сотрудник службы контроля качества
не видит в поиске ту информацию, которую должен видеть специалист по
продажам).
Сами по себе провайдеры поиска, использующиеся в MS SharePoint 2010,
оптимизированы для работы с большими объемами контента – от 100 млн
документов. В случае с движком FAST SharePoint 2010 позволяет
масштабировать систему поиска в зависимости от количества документов в
хранилище или от количества выполняемых поисковых запросов в секунду.
Расширяемость поиска в MS Office 2010
Классические критерии выбора поискового механизма - полнота,
релевантность и реализация ранжирования. Тем не менее на сегодняшний
день при выборе средства поиска на основе этих критериев повышенные
требования предъявляются к управлению поисковым индексом (то есть, что
именно должно попасть или не попасть в рабочую область), точности
результатов и распределения их относительно тех или иных оснований.
Рассмотрим это на примере страницы поисковой выдачи, опубликованной на
корпоративном портале на базе MS SharePoint 2010, имеющей установленные
поисковые провайдеры.
Увеличить
Страница результатов поиска в MS SharePoint 2010 состоит из блоков, задающих параметры поиска
По центру страницы располагается основной блок с найденными
результатами в виде списка документов с гиперссылкой, заголовком и
аннотацией (если она присутствует в свойствах файла).
Сергей Курьянов, директор по развитию
DocsVision: "Поиск документа не сводится исключительно к контекстному
поиску по вхождению ключевого слова и к атрибутивному поиску по
реквизитам. Это также и возможность группировать документы в форме
"облака тэгов" и видеть рейтинги найденных документов в результатах
поиска. Эти возможности, уже несколько лет считающиеся стандартной
частью поиска на корпоративных интернет-сайтах, теперь добавлены
Microsoft и в SharePoint 2010".
Для некоторых типов файлов может отображаться и панель
предварительного просмотра содержимого – например, для презентации в
поиске появятся слайды. Сортировать результаты поиска можно по разным
критериям в специальном выпадающем меню в верхнем правом углу.
Пользователь может также перемещать найденные результаты в общем списке
на основании собственных представлений о релевантности найденного
контента, а также добавления рейтинговой оценки. Там же отображается
иконка федеративного поиска для пользователей Windows 7/2008 Server R2,
позволяющая включать в индекс дополнительные источники данных. В левой
колонке находятся дополнительные параметры поиска, выполненные в виде
интерактивных элементов, расширяющих или сужающих индекс по тем или
иным критериям (время создания, тип, размер, язык и так далее). В
правой части отображаются предыдущие или связанные запросы.
Помимо файлов, в MS SharePoint 2010 можно искать людей. Их можно
сортировать по уровню компетенции, доступности, местонахождению,
активности и прочим метаданным. Если пользователь, например,
сомневается в правильности написания имени сотрудника, то поисковой
механизм все равно выдаст результат на основании фонетических
совпадений.
Увеличить
В MS SharePoint 2010 для нахождения контента можно применять расширенный поиск по параметрам
В любых системах, созданных для управления данными, поисковые
механизмы играют ключевую роль. Контент, находящийся в хранилищах,
часто может быть недоступен для пользователей из-за отсутствия
инструментов по его индексации (например, если речь идет о
мультимедиа). Однако поисковые решения сегодня должны обеспечивать не
только доступ к документам из разных источников в едином интерфейсе, но
и быть расширяемыми для применения в новых условиях (персональный
поиск, "скрытый" поиск, мобильный поиск и так далее). Однако во многом
применение таких средств зависит от уровня зрелости компании-заказчика,
выраженного, например, в стремлении использовать не отдельные поисковые
приложения, а продукты, построенные на поисковых технологиях для
решения конкретных бизнес-задач и создания интегрированной с другими ИС
пользовательской рабочей среды.