Про порядок в тэгах | Seobaby

Автор/Время:

  • on 24.03.2008
  • at 11:51 ДП
  • by seobaby

Про порядок в тэгах



Да, я опять о тэгах, извините. Не буду тут описывать все прелести тэгового подхода к структуризации данных. Я о тэгах писала уже много (1, 2, 3, 4). Хотя в данном контексте понадобится, вероятно, лишь первая ссылка. Я понимаю прекрасно, что тема тэгов уже раскрыта давно, и что тэги уже являются привычным стандартом, и все привыкли и к ним, и к небольшим проблемам, с ними связанными, но…
Да, речь о фолксономии, конкретнее о том, что одно и тоже понятие могут обозначать разные слова. И тут даже не о синонимии речь, а даже если по минимуму брать – просто различное написание слов. Вот концепция Web 2.0. А Web2.0, Веб 2.0 и Веб2.0 – ведь абсолютно тоже самое. Мало того, что это путает, надо лезть в свои тэги смотреть, надо сверяться с чужими, что-то править, так еще насколько неудобно это для поиска.

Я так, коротенечко. Допустим, пощу я фотку во фликре, черно-белую. Ну и, соответственно, тэги к ней выставляю. Вся совокупность может быть такой: ч/б, черно-белое, чб, bw, b&w, black and white (не говоря уж о пробелах, дефисах, слэшах и/или их отсутствии). Ну так вот, я чет не понимаю, почему не существует еще некой системы упорядочивания тэгов. То есть, допустим, если все мои фотки были bw, а я вдруг пишу новый тэг – b&w – так почему мне не могут сказать: родная, у тебя есть тэг такой-то, хочешь его поставить? Я буду благодарна, чтобы не засорять. Просто сама по себе сторонник минимализма и порядка, на рабочем столе крайне мало всего и по необходимости, лишние вкладки в браузере всегда закрываю, и т.п. То есть, чтобы мне на основе вводимых тэгов подсказывали, что у меня уже есть. Ну да, есть такая вещь как автозаполнение. Полезная, безусловно, и отчасти она решает проблему. Но, простите, ведь black and white и white and black (немножко коряво, но для примеру) уже в автоазполнении не сработают, хотя суть одно и то же..

Далее, почему бы не сделать, чтобы мне выводилась подсказочка, мол, а ты знаешь, самый популярный тэг – это именно b&w, а не bw. Тут конечно дело вкусов, но кому-то такая информация не помешала бы. Если бы при этом еще бы сделали возможность идентификации слов в разных языках, типа b&w=ч/б, было бы вообще чудесно, хотя я может слишком много хочу? Ну просто при введении «ч/б», чтобы автоматом проставлялся аналог (да, я понимаю, что в этом случае нобходимо будет произвести некоторые настройки, но если уж любишь кататься..).

Ну или в сервисах закладок… Например сохраняю я статью с пометкой «UI», и чтобы система знала сама по себе, что данный тэг соответствует «user interface», и что, если кто-то вдруг будет искать среди закладок те, что помечены как user interface, то система должна выдавать и те, что помечены как UI (или ui, кстати, тоже), ну хотя бы как дополнительные варианты поиска.. на крайняк

Да, я прекрасно знаю о таких вещах как related tags (схожие тэги), это уже какой-то шаг, и может быть даже и решение проблемы… Но решать придется в итоге все равно юзеру. То есть я считаю, что такие процессы должны быть автоматизированы. И что если design и ui – это related tags, то уж ui и user interface – так это ваще одно и то же.

В общем, я тут распыляться не буду, просто интересно (ну и даже чуток возмущает, не без этого), почему нет каких-то.. алгоритмов или чего-нибудь, по упорядочиванию тэгов и уменьшению фолксономии. Ну не то что это зло, но в конечном счете нам-то самим и неудобно выходит.. Я, впрочем, понимаю, что это весьма нелегко сделать. Но сколько лет уже тэги существуют…

upd. Все-таки, чтобы сие происходило, необходимо,  чтобы тэги, так сказать, угадывали значения друг друга и находили себе братьев по разуму, то бишь кучковались по определенным признакам.  Как ни крути, без семантики здесь не обойтись.  Но кто будет это делать? А вот юзеры. Вспомните время, когда тэги только начали приживаться. Вам не кажется, что это была некая игра, игрушка точнее, с которой можно играться бесконечно, пока не надоест, и которая никогда не закончтся?.. Это было интересно пользователям. Они клюнули. Вот не зря ж есть понятие «развивающие игры».  Означает то,  что любого можно научить  чему-то через игру. И через игру оно будет легче учиться, потому что есть интерес, желание.  Ну вот.  Кароче, Склифасофский.. Юзерам под силу самим разгрести это болото и научить тэги друг друга узнавать. Естественно, этим будет заниматься меньшинство (вот для меня, например, до сих пор загадка, кто пишет Википедию? ну кто тоже пишет..). Но пользователям под силу самим указывать ассоциации, то, есть, например, записывать, с какими тэгами ассоциируется у него данный тэг, в какую категорию он отнес бы его. Само собой система должна быстро обучаться и показывать наглядно «вот видишь, не дура я вовсе, все ловлю на лету, только please.. be gentle»)). Просто надо дать людям легкость работы.. Заинтересовать их.. Ну да, пусть будет игрушкой.. Но сколько пользы?  И вообще,  вот есть у людей идеи, а они говорят – ну это все для юзеров, а кто из них будет это делать? Им же лень. Ну все верно… Им лень. Нам всем лень. Лень – следствие отсутствия интереса, только и всего.

А, так вот еще плюс ко всему надо, чтобы для всего этого прекрасного безобразия был один общий сервер, к которому могли бы подключаться различные сервисы, для которых актуальна такая тэговая проблема.. Заимствуют функцонал – отдают обработнные результаты.. вот чет типа того.. какой-то такой open tag. Вообще все это мне пришло в голову прошлым летом. И проблема, и сервисы, и open tag.. Задержалась я как-то, да?.. Есть ли смысл в этом всем? Ну есть.. только не уверена, что такой смысл, ради которого кто-то возьмется это делать.

rss feed комментариев

Комментарии(34)

  1. Артём Курапов:

    Вы прыгаете между морфологией (разное написание слов), синтаксисом (разный порядок), семантикой (схожие смыслы) и прагматикой (разные языки и логические выводы).

    Сам вижу в этом проблему когда пишу статью – приходится сверяться с существующим облаком тэгов.

  2. seobaby:

    Артем, я не прыгаю, я в этом свободно плаваю. Я популярно объяснила.
    Ну хотя бы да, когда статьи пишешь.. Ну автозаполнение порой помогает.. Но не панацея же. ТЕм более что это внешнее решение проблемы.

  3. J()KER:

    Скорее всего, это основной недостаток (?) тегов как способа упорядочивания информации.

  4. seobaby:

    вопросик вы правильно поставили. думаю, чтоэто от человека зависит. Но мне очень странно просто было, что этого нет. Я потому и пишу, может я не замечаю каких то очень больших минусов?

  5. lavoskin:

    «Плач Ярославны» запиши в MP3 и пусти тихим таким фоном к этому посту, самое то будет :)
    А ваще пиши истчо …

  6. seobaby:

    к каждой статье будьте любезны плейлист сформировать..

  7. Вэ:

    про закладки: в новой версии Diigo при добавлении закладки подгружается список рекомендованных тегов…

  8. seobaby:

    ну, это уже неплохо. не смотрела я пока новый дииго. надо позырить. спс

  9. Денис:

    Я думаю задача автоматизации наведения порядка в тегах относится к труднореализуемой, если не к невыполнимой.

    Проще фильтровать теги после ролучения облака вручную. Это не напрягает пользователя, и вобщем-то подъемлимая задача :)

  10. seobaby:

    вот.. почему ж это так невыполнимо… думаю, без шаманства тут не обойтись.. с шаманами что ли пообщаться..

  11. Уникальный Человек:

    «Ну так вот, я чет не понимаю, почему не существует еще некой системы упорядочивания тэгов.»

    Вот именно. Я тоже давно уже думаю. До сих пор не смогли ничего придумать.

  12. Тормоз:

    Поддерживаю. Я как раз недавно наконец-то зарегился на «одноклассниках», и мне было очень неудобно выбирать своих из трех вариантов названия школы… (аналог тэгов, в общем-то).

  13. seobaby:

    да, там конечно страшный ужос, что ни говори.. ну видно их там такой подход более устраивает. что то в нем есть такое, что менять не хотят…больше кликов по сайту?

  14. Тормоз:

    Просто пофиг, я думаю. Пользователей от этого не меньше :)

  15. Тормоз:

    Кстати, всё же есть мировой эфир, наверно. Постоянно бывает так, что думаешь о чем-то, и тут же натыкаешься на это. Просто именно сегодня говорил с товарищем на ту же тему – про то, как должен вести себя интерфейс при добавлении тэгов.

  16. seobaby:

    хм… ты думаешь там директора по развитию и маркетингам в основном занимаются тем что х. ложат? не оспариваю..))

  17. Alar:

    seobaby, веб 2.0 Полностью захватило вас, толкьо если учитывать, что раньше поисковики совсем не одобряли эти теги, то серьезные сайты не разивали это направление. Я считаю лишь соц сети, в которых не так важен траффик с поисковиков по ключевикам дали толчок в этом направлении, но у них как раз с тегами все нормально. Так в чем же проблема? выбрать админов в ручную 100 правильных тегов?

    В ворпрессе только недавно появились теги, дальше больше я считаю.

  18. seobaby:

    Тормоз, это идеосфера. Если ты думаешь об этом, то кто-то еще думает об этом стопудов)) поэтому стремно делать новые проекты, гы))

  19. Тормоз:

    Ничего не стремно, надо только успевать первым :)

  20. seobaby:

    Alar, меньше всего я здесь говорю о ручном модерировании. и что значит правильных тэгов? такогоне бывает. Как то не так вы меня поняли, что ли..

  21. Alar:

    правильных значит по теме, например, блога.
    Допустим, я написал алгоритм удаления из базы тегов из одной и двух букв. Все на этом :).

    Нужно что-то более мощное? нужно параллельно таблице тегов вести таблицу – соответсвует ли тег “user interface” и прочее?

  22. Денис:

    Я думаю что пользователя нагружать подсказками не обязательно, пусть пишет че хочет. Следовательно, если отбросить ручную обработку, нужна технология, которая объединяет всякие синонимы и неверные написания под один тег. При чем работать она должна безотказно.

    Какая идея реализации?

  23. seobaby:

    ну может и не обязательно. я думаю что без семантики там ну никак не обойтись..

  24. Dimonuch:

    Видишь ли … компьютер это тупой автомат, в котором есть всего лишь две цифры – 0 и 1. ВСЕ. Он не умеет думать. Частные случаи он решать может. Но в общем думать за человека – слабо.

  25. seobaby:

    не. думаю ты как раз и неправ. ему просто не нужно думать за человека.процесс с другого конца начинается – человек думает за него изначально. ну и как известно рыба гниет с головы..так что проблема не в корыте..

  26. shuron:

    Для наведения порядка в тегах вордпресса есть удоюные плагины. Например Headspace2

  27. Миша:

    Самый простой и надежный вариант — посадить специального человека, который бы связывал друг с другом родственные теги. То есть, если автор поста указывает тег Веб 2.0, а посетитель ищет Web2.0, то пост найдется.

  28. seobaby:

    угу, тысяча мартышек в подвале.. есть иная мысль. надо ее наверное дописать

  29. abo:

    Сегодня праздник, позвольте вас поздравить! Почему именно вас – можно узнать в моём блоге.

  30. Alvin:

    По-моему методика построения «древовидной» структуры тегов по принципу более общего и частного терминов + облако синонимов + облако ошибочных написаний полностью решает данную проблему при участии грамотного модератора на этапе формирования изначального «дерева» тегов(облаком это уже назвать сложно) и последующего отслеживания «новинок». С т.з. реализации решений может быть не одно и не два. Самое простое – руки модератора, более сложное морфологический разбор и сравнение частей слов при анализе новых тегов.

    То о чем я написал не в коем случае не исключает механизм suugest’ов, наоборот, оно делает его более интеллектуальным.

  31. Alvin:

    2 Dimonuch:
    Никто его не заставляет принемать окончательное решение, но сузить рамки принятия решения вполне реально, естественно, оставив окончательное решение за человеком.

    В противном случае при «облаке» в 2к, например, появление нового тега будет приводить к необходимости анализа ВСЕГО имеющегося… не особо удобно?!

    ЗЫ: Тупой автомат = кривые руки и мозХ комманды, задействованной в проекте.

  32. BlogLabelArt » Blog Archive » Про порядок в тэгах:

    [...] Источник и полная версия: http://creationsait.ru/archives/209 [...]

  33. jupy:

    Рекомендую посмотреть здесь (http://moat-project.org/). Весьма простой подход, и, на мой взгляд, очень перспективный.

  34. alexey_og:

    Вопрос, в какой-то мере из разряда психологических. Не все юзеры, охваченные поиском, точно представляют на момент самого поиска что они хотят найти. Ключевое слово в вышесказанном – «точно». Сам неоднократно сталкивался с такой ситуацией. Например, я решил найти предложения по конструкции загородительных сооружений (попросту говоря, забор для дачи найти надо). С данной проблемой я столкнулся впервые, а потому дилетант в этой сфере. Поэтому по мере изучения ее мои запросы станут более конкретными и узкими. А поначалу я буду стрелять мелкой дробью с большим диапазоном рассеивания. Учтите, что большинство пользователей поисковых систем, столкнувшись с необходимостью что-либо отыскать, поначалу сами не склонны сужать широту поиска.

Please, feel free to post your own comment