Практический Семантик | Seobaby

Автор/Время:

  • on 12.12.2007
  • at 03:35 ПП
  • by seobaby

Практический Семантик



Веб2 – это, конечно, сервисы прежде всего. Теория теорией, но главное – сайтики. Это всем понятно итак. А вот с семантическим вебом – непонятно пока что.. Мы с вами все теорией балуемся. Ну хотя объяснение довольно простое – как таковых семантических веб-приложений… ну мало, короче. Но они есть!

Ну я подумала, что было бы неплохо пролить свет на это таинственное явление – семантические сервисы. Но прежде советую прочитать вот этот пост. Не пеара ради, а дабы понять, каким образом вообще можно реализовывать семантические приложения. Хотя я вкратце, конечно, расскажу. Вообще нам, прежде чем говорить о семантических сервисах нужно понять, для чего они нужны. (Хотя нет, блин, вы всетки прочитайте сначала))

Семантика по жизни (ну то есть в лингвистике, а не применимо к программированию) – весьма интересная наука, занимающаяся изучением значения слов (ну и жизнью этих значений, как одно слово может менять свои значения в течение времени. очень занимательно, правда). Поэтому считаю вполне правомерны предположить, что семантические сервисы (в дальнейшем – SWA – semantic web apps) тем и занимаются, что определяют значение данных (ну текст, допустим) и связи (отношения между собой) этих данных. Вот в этом случае мы уже можем говорить о знаменитом Web as a platform. Плюс учитываем то, что есть два направления развития SWA (вы ведь прочитали, правда?))):
- снизу-вверх: когда весь веб-контент сам по себе является структурированным и, короче, семантическим – в нем уже есть все необходимые мета-данные.
- сверху-вниз: с контентом ничего не происходит, он такой же, а вот специальные программы уже анализируют его на свой семантический лад.
Ну поехали.

Поисковые системы (Ну было бы странно, если начала я не с них))

Powerset – продукт пока еще закрытый, но за этот год наделавший довольно шуму в новостях. Системка эта определяет семантические связи, на основе которых складывается семантическая база данных. Значения слов автоматически извлекаются из Powerset. Работа у них кипит, привлекают различных сторонних разработчиков в свою Powerlabs. Если хотите чуть подробнее о них – то здесь.

Hakia – еще один NLP (natural language processing) поисковик. Hakia выдает значимые результаты на поисковый запрос посредством анализа предложения (ну а Google и иже с ним, как мы знаем, анализируют ключевые слова). Hakia хотят изменить поисковый мир в лучшую сторону, то есть сделать поиск вашим товарищем и гидом в мире интернета. Интерактивным. Кстати, в Hakia не все автоматизировано, присутствует и человеческий фактор, например модерирование картинок. Еще о Hakia – здесь.

AskNet – российская разработка, которая не так давно сильно приукрасилась и вообще стала стартовой страницей. (а я только что это заметила кстати).Сильно пдробно о них сказать не могу, они не освещались настолько сильно, но предлагаю почитать интервью с Asknet, довольно интересное.

Да, еще существует в России такой сервис как Dialogus. Но я его не изучала, если честно. Но он семантический, да))

TrueKnowledge – нечто среднее между поиском и сервисом вопросов-ответов. Также в закрытой бете пока. TrueKnowledge использует анализ естественного языка, внутреннюю «базу знаний» и стороннюю, тут же предлагая вам ответы на заданные вопросы. Не просто, как поисковик, дает вам ссылки, где вы можете найти ответы, а развернутые ответы. Да и еще укажет, с чего это он взял, что ответ должен быть именно таким. Лозунг компании – прямые ответы на человеческие и машинные вопросы.

Взаимодействие пользователей

Freebase – база любых типов данных. Также имеет свой API. Freebase открыт для всех, любой может внести информацию, и вообще это открытая база данных. Freebase во многом похожа на Wikipedia.

Когда вы вводите новые данные, сервис делает предположения о контенте. Довольно организованный сервис, темы разбиты по типам, страницы можно линковать между собой, также данные обладают семантическими тэгами. Честно говоря, особой разницы с Википедией и нет, только семантика внедрена. Ну и покрасивше будет, чего уж))

Twine – качественно новая социальная сеть, основанная на концепции СемантикВеба. Она тоже в закрытой бете пока, поэтому трудно говорить о ней что-то конкретное, но действует она следующим образом. Twine изучает вас и ваши интересы по мере наполнения. Когда вы вводите новые данные, Twine приписывает им семантические тэги – например «имя человека». Twine создает семантические данные, но это не 100% UGC. Twine многому учится сам. В итоге это должно вылиться в нечто подобное Freebase, то есть семантическую Википедию.

Инструменты

Это, конечно, самая интересная группа.

TripIt – ваш помощник в путешествиях. На ящик plans@tripit.com вам нужно отправить какие-то данные о своей поездке – куда и когда. А сервис на основе этого составляет вам расписание вашего путешествия, то есть itinerary. Отсюда название технологии – itinerator, которая находится в стадии патентования. Сотрудничает с Википедией, чтобы брать информацию о местах ваших путешествий, использует микроформаты- iCal, который легко можно интегрировать в ГуглКалендарь или другие календари. Распечатываете себе пару страничек – и спокойно отправляетесь в путь. В планах – внедрение рекомендательной системы.

ClearForest – сервис, анализирующий веб-контент путем «сверху-вниз», использующий NLP. Был приобретен в Апреле агентством Reuters. Это как веб-сервис, так и расширение для Firefox – Gnosis.

Это расшрение позволяет идентифицировать людей, компании, местонахождения, продукты на странице, которую вы просматриваете. Просматривая страницу с помощью Gnosis, на ней появляются различные краткие аннотации, слова выделяются цветом, чтобы можно было понять, о чем идет речь. Тоже самое можно сделать и на сайте компании (правда, если честно, мне не очень понятно как.. неудобный сайтец какой-то).

AdaptiveBlue – компания, имеющая в своем арсенале два продукта – расширение для FireFox BlueOrganizer и SmartLinks. BlueOrganizer распознает то, о чем вы читаете. Ну допустим, вы находитесь на странице с книжкой какой-нибудь. BlueOrganizer это поймет, он преложит вам специальное меню (которое составляется из вашей истории серфинга), что с этой страницей можно сделать – добавить в вишлист на Амазоне, найти что-то схожее, предложить запостить куда-нить. Там же можно сохранять, и при этом плагин сам распознает, что в какую папочку надо сохранять. В общем функционал серьезный, но пока что сомнительна его актуальность для наших широт. Такой вот тулбарчик вышел:

Smartlinks – скриптик, добавляющий новые возможности ссылкам (на вашем блоге допустим), дают дополнительную информацию по ним. Разрозненную информацию он структуризирует (ну сематнически, естественно))), типы контента распознает, придает ей дополнительную информацию, в общем молодца. И выглядит симпатишно, вот так (кстати это типа поп-апа):

Zotero – чем то схожий с BlueOrganizer плагин для ФФ, который позволяет хранить и организовывать различные типы контента (цитаты, текст, картинки, веб-страницы, PDF) и делиться ими различными способами. В общем, очередной органайзер такой.

Talis – компания, сотворившая одноименный продукт, платформу для SWA (платформа, это вам не.. википедия блин). Платформа Talis -нечто среднее между web2 и semantic web, позволяя создавать приложения, которые дают возможность шаринга и ремиксинга данных)). Платформа делает упор на важность контекста, поведение пользователя (и отслеживание его действий).
p.s. у них классный блог, кому интересен семантик – пройдитесь, почитайте.

По мотивам

rss feed комментариев

Комментарии(10)

  1. Уникальный Человек:

    Каждый твоей статье удивляюсь. Гениально написано, чесслово!

  2. seobaby:

    спасибо. мне очень приятно, правда..)

  3. Практический Семантик : Блог Молчуна:

    [...] Веб2 – это, конечно, сервисы прежде всего. Теория теорией, но главное – сайтики. Это всем понятно итак. А вот с семантическим вебом – непонятно пока что.. Мы с вами все теорией балуемся. Ну хотя объяснение довольно простое – как таковых семантических веб-приложений… ну мало, короче. Но они есть! Дальше [...]

  4. Тормоз:

    Обалдеть! За последние несколько месяцев лучше статьи не читал. Большое спасибо.
    Особенно за наводку на API Freebase. Очень классно. Жаль, что у других сервисов, похоже, API нет, хотя было бы чудесно найти какой-то интерфейс для запросов на Clearforest.com. Хотя может быть я просто не разобрался пока. В общем, в избранное, однозначно! )

    P.S. Для прикола спросил у Dialogus.ru «что такое тормоз», и получил ответ: «Ручной тормоз – это эстонская кошечка!» ))

  5. seobaby:

    ну вот и хорошо, что помогло.
    p.s. ну да, все поисковики смешными бывают

  6. seobaby:

    у TrueKnowledge есть API, говорят. У Clearforest их расширение для ФФ работает также через API.

  7. Тормоз:

    Спасибо, поизучаю сейчас…

  8. Игорь:

    Вот нашел твою статейку блин молодец же Давай дальше подобное

  9. ajax unlover:

    Не, ну очень интересная позиция – вырезать без объяснений просьбу прокомментировать – как бы так, что ‘иноверных посетителей’ вашего блога не существует. Безусловно, ваше святое право, леди.
    Тогда в Инете, коль так, однажды придется написать и о Вашем блоге и о лично вашей интерпретации Semantics, Уж сорри.

  10. seobaby:

    я одобрила ваши комментарии? да. я обязана в воскресенье вам отвечать если вам сильно не терпится? вроде нет. Можете написать хоть лично о плохой мне, если я вас так сильно задела. И кстати, вы не в тот пост коммент запостили.

Please, feel free to post your own comment