Веб2 – это, конечно, сервисы прежде всего. Теория теорией, но главное – сайтики. Это всем понятно итак. А вот с семантическим вебом – непонятно пока что.. Мы с вами все теорией балуемся. Ну хотя объяснение довольно простое – как таковых семантических веб-приложений… ну мало, короче. Но они есть!
Ну я подумала, что было бы неплохо пролить свет на это таинственное явление – семантические сервисы. Но прежде советую прочитать вот этот пост. Не пеара ради, а дабы понять, каким образом вообще можно реализовывать семантические приложения. Хотя я вкратце, конечно, расскажу. Вообще нам, прежде чем говорить о семантических сервисах нужно понять, для чего они нужны. (Хотя нет, блин, вы всетки прочитайте сначала))
Семантика по жизни (ну то есть в лингвистике, а не применимо к программированию) – весьма интересная наука, занимающаяся изучением значения слов (ну и жизнью этих значений, как одно слово может менять свои значения в течение времени. очень занимательно, правда). Поэтому считаю вполне правомерны предположить, что семантические сервисы (в дальнейшем – SWA – semantic web apps) тем и занимаются, что определяют значение данных (ну текст, допустим) и связи (отношения между собой) этих данных. Вот в этом случае мы уже можем говорить о знаменитом Web as a platform. Плюс учитываем то, что есть два направления развития SWA (вы ведь прочитали, правда?))):
- снизу-вверх: когда весь веб-контент сам по себе является структурированным и, короче, семантическим – в нем уже есть все необходимые мета-данные.
- сверху-вниз: с контентом ничего не происходит, он такой же, а вот специальные программы уже анализируют его на свой семантический лад.
Ну поехали.
Поисковые системы (Ну было бы странно, если начала я не с них))
Powerset – продукт пока еще закрытый, но за этот год наделавший довольно шуму в новостях. Системка эта определяет семантические связи, на основе которых складывается семантическая база данных. Значения слов автоматически извлекаются из Powerset. Работа у них кипит, привлекают различных сторонних разработчиков в свою Powerlabs. Если хотите чуть подробнее о них – то здесь.
Hakia – еще один NLP (natural language processing) поисковик. Hakia выдает значимые результаты на поисковый запрос посредством анализа предложения (ну а Google и иже с ним, как мы знаем, анализируют ключевые слова). Hakia хотят изменить поисковый мир в лучшую сторону, то есть сделать поиск вашим товарищем и гидом в мире интернета. Интерактивным. Кстати, в Hakia не все автоматизировано, присутствует и человеческий фактор, например модерирование картинок. Еще о Hakia – здесь.
AskNet – российская разработка, которая не так давно сильно приукрасилась и вообще стала стартовой страницей. (а я только что это заметила кстати).Сильно пдробно о них сказать не могу, они не освещались настолько сильно, но предлагаю почитать интервью с Asknet, довольно интересное.
Да, еще существует в России такой сервис как Dialogus. Но я его не изучала, если честно. Но он семантический, да))
TrueKnowledge – нечто среднее между поиском и сервисом вопросов-ответов. Также в закрытой бете пока. TrueKnowledge использует анализ естественного языка, внутреннюю «базу знаний» и стороннюю, тут же предлагая вам ответы на заданные вопросы. Не просто, как поисковик, дает вам ссылки, где вы можете найти ответы, а развернутые ответы. Да и еще укажет, с чего это он взял, что ответ должен быть именно таким. Лозунг компании – прямые ответы на человеческие и машинные вопросы.
Взаимодействие пользователей
Freebase – база любых типов данных. Также имеет свой API. Freebase открыт для всех, любой может внести информацию, и вообще это открытая база данных. Freebase во многом похожа на Wikipedia.
Когда вы вводите новые данные, сервис делает предположения о контенте. Довольно организованный сервис, темы разбиты по типам, страницы можно линковать между собой, также данные обладают семантическими тэгами. Честно говоря, особой разницы с Википедией и нет, только семантика внедрена. Ну и покрасивше будет, чего уж))
Twine – качественно новая социальная сеть, основанная на концепции СемантикВеба. Она тоже в закрытой бете пока, поэтому трудно говорить о ней что-то конкретное, но действует она следующим образом. Twine изучает вас и ваши интересы по мере наполнения. Когда вы вводите новые данные, Twine приписывает им семантические тэги – например «имя человека». Twine создает семантические данные, но это не 100% UGC. Twine многому учится сам. В итоге это должно вылиться в нечто подобное Freebase, то есть семантическую Википедию.
Инструменты
Это, конечно, самая интересная группа.
TripIt – ваш помощник в путешествиях. На ящик plans@tripit.com вам нужно отправить какие-то данные о своей поездке – куда и когда. А сервис на основе этого составляет вам расписание вашего путешествия, то есть itinerary. Отсюда название технологии – itinerator, которая находится в стадии патентования. Сотрудничает с Википедией, чтобы брать информацию о местах ваших путешествий, использует микроформаты- iCal, который легко можно интегрировать в ГуглКалендарь или другие календари. Распечатываете себе пару страничек – и спокойно отправляетесь в путь. В планах – внедрение рекомендательной системы.
ClearForest – сервис, анализирующий веб-контент путем «сверху-вниз», использующий NLP. Был приобретен в Апреле агентством Reuters. Это как веб-сервис, так и расширение для Firefox – Gnosis.
Это расшрение позволяет идентифицировать людей, компании, местонахождения, продукты на странице, которую вы просматриваете. Просматривая страницу с помощью Gnosis, на ней появляются различные краткие аннотации, слова выделяются цветом, чтобы можно было понять, о чем идет речь. Тоже самое можно сделать и на сайте компании (правда, если честно, мне не очень понятно как.. неудобный сайтец какой-то).
AdaptiveBlue – компания, имеющая в своем арсенале два продукта – расширение для FireFox BlueOrganizer и SmartLinks. BlueOrganizer распознает то, о чем вы читаете. Ну допустим, вы находитесь на странице с книжкой какой-нибудь. BlueOrganizer это поймет, он преложит вам специальное меню (которое составляется из вашей истории серфинга), что с этой страницей можно сделать – добавить в вишлист на Амазоне, найти что-то схожее, предложить запостить куда-нить. Там же можно сохранять, и при этом плагин сам распознает, что в какую папочку надо сохранять. В общем функционал серьезный, но пока что сомнительна его актуальность для наших широт. Такой вот тулбарчик вышел:
Smartlinks – скриптик, добавляющий новые возможности ссылкам (на вашем блоге допустим), дают дополнительную информацию по ним. Разрозненную информацию он структуризирует (ну сематнически, естественно))), типы контента распознает, придает ей дополнительную информацию, в общем молодца. И выглядит симпатишно, вот так (кстати это типа поп-апа):
Zotero – чем то схожий с BlueOrganizer плагин для ФФ, который позволяет хранить и организовывать различные типы контента (цитаты, текст, картинки, веб-страницы, PDF) и делиться ими различными способами. В общем, очередной органайзер такой.
Talis – компания, сотворившая одноименный продукт, платформу для SWA (платформа, это вам не.. википедия блин). Платформа Talis -нечто среднее между web2 и semantic web, позволяя создавать приложения, которые дают возможность шаринга и ремиксинга данных)). Платформа делает упор на важность контекста, поведение пользователя (и отслеживание его действий).
p.s. у них классный блог, кому интересен семантик – пройдитесь, почитайте.
По мотивам
Особенно за наводку на API Freebase. Очень классно. Жаль, что у других сервисов, похоже, API нет, хотя было бы чудесно найти какой-то интерфейс для запросов на Clearforest.com. Хотя может быть я просто не разобрался пока. В общем, в избранное, однозначно! )
p.s. ну да, все поисковики смешными бывают
Тогда в Инете, коль так, однажды придется написать и о Вашем блоге и о лично вашей интерпретации Semantics, Уж сорри.