Про порядок в тэгах

Да, я опять о тэгах, извините. Не буду тут описывать все прелести тэгового подхода к структуризации данных. Я о тэгах писала уже много (1, 2, 3, 4). Хотя в данном контексте понадобится, вероятно, лишь первая ссылка. Я понимаю прекрасно, что тема тэгов уже раскрыта давно, и что тэги уже являются привычным стандартом, и все привыкли и к ним, и к небольшим проблемам, с ними связанными, но…
Да, речь о фолксономии, конкретнее о том, что одно и тоже понятие могут обозначать разные слова. И тут даже не о синонимии речь, а даже если по минимуму брать – просто различное написание слов. Вот концепция Web 2.0. А Web2.0, Веб 2.0 и Веб2.0 – ведь абсолютно тоже самое. Мало того, что это путает, надо лезть в свои тэги смотреть, надо сверяться с чужими, что-то править, так еще насколько неудобно это для поиска.

Я так, коротенечко. Допустим, пощу я фотку во фликре, черно-белую. Ну и, соответственно, тэги к ней выставляю. Вся совокупность может быть такой: ч/б, черно-белое, чб, bw, b&w, black and white (не говоря уж о пробелах, дефисах, слэшах и/или их отсутствии). Ну так вот, я чет не понимаю, почему не существует еще некой системы упорядочивания тэгов. То есть, допустим, если все мои фотки были bw, а я вдруг пишу новый тэг – b&w – так почему мне не могут сказать: родная, у тебя есть тэг такой-то, хочешь его поставить? Я буду благодарна, чтобы не засорять. Просто сама по себе сторонник минимализма и порядка, на рабочем столе крайне мало всего и по необходимости, лишние вкладки в браузере всегда закрываю, и т.п. То есть, чтобы мне на основе вводимых тэгов подсказывали, что у меня уже есть. Ну да, есть такая вещь как автозаполнение. Полезная, безусловно, и отчасти она решает проблему. Но, простите, ведь black and white и white and black (немножко коряво, но для примеру) уже в автоазполнении не сработают, хотя суть одно и то же..

Далее, почему бы не сделать, чтобы мне выводилась подсказочка, мол, а ты знаешь, самый популярный тэг – это именно b&w, а не bw. Тут конечно дело вкусов, но кому-то такая информация не помешала бы. Если бы при этом еще бы сделали возможность идентификации слов в разных языках, типа b&w=ч/б, было бы вообще чудесно, хотя я может слишком много хочу? Ну просто при введении «ч/б», чтобы автоматом проставлялся аналог (да, я понимаю, что в этом случае нобходимо будет произвести некоторые настройки, но если уж любишь кататься..).

Ну или в сервисах закладок… Например сохраняю я статью с пометкой «UI», и чтобы система знала сама по себе, что данный тэг соответствует «user interface», и что, если кто-то вдруг будет искать среди закладок те, что помечены как user interface, то система должна выдавать и те, что помечены как UI (или ui, кстати, тоже), ну хотя бы как дополнительные варианты поиска.. на крайняк

Да, я прекрасно знаю о таких вещах как related tags (схожие тэги), это уже какой-то шаг, и может быть даже и решение проблемы… Но решать придется в итоге все равно юзеру. То есть я считаю, что такие процессы должны быть автоматизированы. И что если design и ui – это related tags, то уж ui и user interface – так это ваще одно и то же.

В общем, я тут распыляться не буду, просто интересно (ну и даже чуток возмущает, не без этого), почему нет каких-то.. алгоритмов или чего-нибудь, по упорядочиванию тэгов и уменьшению фолксономии. Ну не то что это зло, но в конечном счете нам-то самим и неудобно выходит.. Я, впрочем, понимаю, что это весьма нелегко сделать. Но сколько лет уже тэги существуют…

upd. Все-таки, чтобы сие происходило, необходимо, чтобы тэги, так сказать, угадывали значения друг друга и находили себе братьев по разуму, то бишь кучковались по определенным признакам. Как ни крути, без семантики здесь не обойтись. Но кто будет это делать? А вот юзеры. Вспомните время, когда тэги только начали приживаться. Вам не кажется, что это была некая игра, игрушка точнее, с которой можно играться бесконечно, пока не надоест, и которая никогда не закончтся?.. Это было интересно пользователям. Они клюнули. Вот не зря ж есть понятие «развивающие игры». Означает то, что любого можно научить чему-то через игру. И через игру оно будет легче учиться, потому что есть интерес, желание. Ну вот. Кароче, Склифасофский.. Юзерам под силу самим разгрести это болото и научить тэги друг друга узнавать. Естественно, этим будет заниматься меньшинство (вот для меня, например, до сих пор загадка, кто пишет Википедию? ну кто тоже пишет..). Но пользователям под силу самим указывать ассоциации, то, есть, например, записывать, с какими тэгами ассоциируется у него данный тэг, в какую категорию он отнес бы его. Само собой система должна быстро обучаться и показывать наглядно «вот видишь, не дура я вовсе, все ловлю на лету, только please.. be gentle»)). Просто надо дать людям легкость работы.. Заинтересовать их.. Ну да, пусть будет игрушкой.. Но сколько пользы? И вообще, вот есть у людей идеи, а они говорят – ну это все для юзеров, а кто из них будет это делать? Им же лень. Ну все верно… Им лень. Нам всем лень. Лень – следствие отсутствия интереса, только и всего.

А, так вот еще плюс ко всему надо, чтобы для всего этого прекрасного безобразия был один общий сервер, к которому могли бы подключаться различные сервисы, для которых актуальна такая тэговая проблема.. Заимствуют функцонал – отдают обработнные результаты.. вот чет типа того.. какой-то такой open tag. Вообще все это мне пришло в голову прошлым летом. И проблема, и сервисы, и open tag.. Задержалась я как-то, да?.. Есть ли смысл в этом всем? Ну есть.. только не уверена, что такой смысл, ради которого кто-то возьмется это делать.

rss feed комментариев

Комментарии(34)

Артём Курапов:

24 Март 2008 в 12:38

Вы прыгаете между морфологией (разное написание слов), синтаксисом (разный порядок), семантикой (схожие смыслы) и прагматикой (разные языки и логические выводы).

Сам вижу в этом проблему когда пишу статью – приходится сверяться с существующим облаком тэгов.

Ответить
seobaby:

24 Март 2008 в 12:50

Артем, я не прыгаю, я в этом свободно плаваю. Я популярно объяснила.
Ну хотя бы да, когда статьи пишешь.. Ну автозаполнение порой помогает.. Но не панацея же. ТЕм более что это внешнее решение проблемы.

Ответить
J()KER:

24 Март 2008 в 13:14

Скорее всего, это основной недостаток (?) тегов как способа упорядочивания информации.

Ответить
seobaby:

24 Март 2008 в 13:16

вопросик вы правильно поставили. думаю, чтоэто от человека зависит. Но мне очень странно просто было, что этого нет. Я потому и пишу, может я не замечаю каких то очень больших минусов?

Ответить
lavoskin:

24 Март 2008 в 13:18

«Плач Ярославны» запиши в MP3 и пусти тихим таким фоном к этому посту, самое то будет :)
А ваще пиши истчо …

Ответить
seobaby:

24 Март 2008 в 13:20

к каждой статье будьте любезны плейлист сформировать..

Ответить
Вэ:

24 Март 2008 в 14:34

про закладки: в новой версии Diigo при добавлении закладки подгружается список рекомендованных тегов…

Ответить
seobaby:

24 Март 2008 в 14:41

ну, это уже неплохо. не смотрела я пока новый дииго. надо позырить. спс

Ответить
Денис:

24 Март 2008 в 14:42

Я думаю задача автоматизации наведения порядка в тегах относится к труднореализуемой, если не к невыполнимой.

Проще фильтровать теги после ролучения облака вручную. Это не напрягает пользователя, и вобщем-то подъемлимая задача :)

Ответить
seobaby:

24 Март 2008 в 14:51

вот.. почему ж это так невыполнимо… думаю, без шаманства тут не обойтись.. с шаманами что ли пообщаться..

Ответить
Уникальный Человек:

24 Март 2008 в 16:21

«Ну так вот, я чет не понимаю, почему не существует еще некой системы упорядочивания тэгов.»

Вот именно. Я тоже давно уже думаю. До сих пор не смогли ничего придумать.

Ответить
Тормоз:

24 Март 2008 в 16:42

Поддерживаю. Я как раз недавно наконец-то зарегился на «одноклассниках», и мне было очень неудобно выбирать своих из трех вариантов названия школы… (аналог тэгов, в общем-то).

Ответить
seobaby:

24 Март 2008 в 16:45

да, там конечно страшный ужос, что ни говори.. ну видно их там такой подход более устраивает. что то в нем есть такое, что менять не хотят…больше кликов по сайту?

Ответить
Тормоз:

24 Март 2008 в 16:48

Просто пофиг, я думаю. Пользователей от этого не меньше :)

Ответить
Тормоз:

24 Март 2008 в 16:49

Кстати, всё же есть мировой эфир, наверно. Постоянно бывает так, что думаешь о чем-то, и тут же натыкаешься на это. Просто именно сегодня говорил с товарищем на ту же тему – про то, как должен вести себя интерфейс при добавлении тэгов.

Ответить
seobaby:

24 Март 2008 в 16:51

хм… ты думаешь там директора по развитию и маркетингам в основном занимаются тем что х. ложат? не оспариваю..))

Ответить
Alar:

24 Март 2008 в 16:51

seobaby, веб 2.0 Полностью захватило вас, толкьо если учитывать, что раньше поисковики совсем не одобряли эти теги, то серьезные сайты не разивали это направление. Я считаю лишь соц сети, в которых не так важен траффик с поисковиков по ключевикам дали толчок в этом направлении, но у них как раз с тегами все нормально. Так в чем же проблема? выбрать админов в ручную 100 правильных тегов?

В ворпрессе только недавно появились теги, дальше больше я считаю.

Ответить
seobaby:

24 Март 2008 в 16:56

Тормоз, это идеосфера. Если ты думаешь об этом, то кто-то еще думает об этом стопудов)) поэтому стремно делать новые проекты, гы))

Ответить
Тормоз:

24 Март 2008 в 17:05

Ничего не стремно, надо только успевать первым :)

Ответить
seobaby:

24 Март 2008 в 17:40

Alar, меньше всего я здесь говорю о ручном модерировании. и что значит правильных тэгов? такогоне бывает. Как то не так вы меня поняли, что ли..

Ответить
Alar:

24 Март 2008 в 22:45

правильных значит по теме, например, блога.
Допустим, я написал алгоритм удаления из базы тегов из одной и двух букв. Все на этом :).

Нужно что-то более мощное? нужно параллельно таблице тегов вести таблицу – соответсвует ли тег “user interface” и прочее?

Ответить
Денис:

24 Март 2008 в 22:55

Я думаю что пользователя нагружать подсказками не обязательно, пусть пишет че хочет. Следовательно, если отбросить ручную обработку, нужна технология, которая объединяет всякие синонимы и неверные написания под один тег. При чем работать она должна безотказно.

Какая идея реализации?

Ответить
seobaby:

24 Март 2008 в 22:57

ну может и не обязательно. я думаю что без семантики там ну никак не обойтись..

Ответить
Dimonuch:

24 Март 2008 в 22:58

Видишь ли … компьютер это тупой автомат, в котором есть всего лишь две цифры – 0 и 1. ВСЕ. Он не умеет думать. Частные случаи он решать может. Но в общем думать за человека – слабо.

Ответить
seobaby:

24 Март 2008 в 23:02

не. думаю ты как раз и неправ. ему просто не нужно думать за человека.процесс с другого конца начинается – человек думает за него изначально. ну и как известно рыба гниет с головы..так что проблема не в корыте..

Ответить
shuron:

27 Март 2008 в 01:09

Для наведения порядка в тегах вордпресса есть удоюные плагины. Например Headspace2

Ответить
Миша:

27 Март 2008 в 09:26

Самый простой и надежный вариант — посадить специального человека, который бы связывал друг с другом родственные теги. То есть, если автор поста указывает тег Веб 2.0, а посетитель ищет Web2.0, то пост найдется.

Ответить
seobaby:

27 Март 2008 в 09:28

угу, тысяча мартышек в подвале.. есть иная мысль. надо ее наверное дописать

Ответить
abo:

1 Апрель 2008 в 12:43

Сегодня праздник, позвольте вас поздравить! Почему именно вас – можно узнать в моём блоге.

Ответить
Alvin:

1 Апрель 2008 в 12:43

По-моему методика построения «древовидной» структуры тегов по принципу более общего и частного терминов + облако синонимов + облако ошибочных написаний полностью решает данную проблему при участии грамотного модератора на этапе формирования изначального «дерева» тегов(облаком это уже назвать сложно) и последующего отслеживания «новинок». С т.з. реализации решений может быть не одно и не два. Самое простое – руки модератора, более сложное морфологический разбор и сравнение частей слов при анализе новых тегов.

То о чем я написал не в коем случае не исключает механизм suugest’ов, наоборот, оно делает его более интеллектуальным.

Ответить
Alvin:

1 Апрель 2008 в 12:50

2 Dimonuch:
Никто его не заставляет принемать окончательное решение, но сузить рамки принятия решения вполне реально, естественно, оставив окончательное решение за человеком.

В противном случае при «облаке» в 2к, например, появление нового тега будет приводить к необходимости анализа ВСЕГО имеющегося… не особо удобно?!

ЗЫ: Тупой автомат = кривые руки и мозХ комманды, задействованной в проекте.

Ответить
BlogLabelArt » Blog Archive » Про порядок в тэгах:

8 Апрель 2008 в 13:50

[...] Источник и полная версия: http://creationsait.ru/archives/209 [...]

Ответить
jupy:

30 Май 2008 в 09:19

Рекомендую посмотреть здесь (http://moat-project.org/). Весьма простой подход, и, на мой взгляд, очень перспективный.

Ответить
alexey_og:

29 Июнь 2008 в 12:27

Вопрос, в какой-то мере из разряда психологических. Не все юзеры, охваченные поиском, точно представляют на момент самого поиска что они хотят найти. Ключевое слово в вышесказанном – «точно». Сам неоднократно сталкивался с такой ситуацией. Например, я решил найти предложения по конструкции загородительных сооружений (попросту говоря, забор для дачи найти надо). С данной проблемой я столкнулся впервые, а потому дилетант в этой сфере. Поэтому по мере изучения ее мои запросы станут более конкретными и узкими. А поначалу я буду стрелять мелкой дробью с большим диапазоном рассеивания. Учтите, что большинство пользователей поисковых систем, столкнувшись с необходимостью что-либо отыскать, поначалу сами не склонны сужать широту поиска.

Ответить

Seobaby

Автор/Время:

Теги:

Про порядок в тэгах

Please, feel free to post your own comment

Детская мебель

Больничный лист купить

Стоимость тура в Тайланд