ISSN 1312-0379

Главна > Статии > Content

Инвентаризация на съдържанието. От Джефри Вийн.

Последната година прекарах в работа с клиенти по различни проблеми на информационната архитектура и дизайна. Един от най-учудващите и повтарящи се често проблеми, беше в това, че много от компаниите все още не са разработили системи за управление на съдържанието. Говорих с предприятия от Fortune 100 (бел. прев. компании, които са в първата стотица на авторитетното икономическо сп. Fortune), които сега осъзнават, че имат съдържание, събирано в продължение на 6 години и че то е залостено в статични HTML файлове. Те знаят, че трябва да вкарат всичко това в база данни и да направят редизайн на сайта, пригаждайки го към система от темплейти. Но неизбежно техният първи въпрос е: “И така, ъъъ, откъде да започнем?”

Ако сте в подобна ситуация, първата ви стъпка трябва да е описването на онова, което имате в наличност. Този процес, познат като инвентаризация на съдържанието, е относително праволинеен процес на преглеждане на целия сайт и записване на това, което бива откривано. Ние разработихме една примерна електронна таблица, за да ви помогнем да структурирате откритията си и ще ви да дадем няколко съвета как да се оправите с нея.

Започнете от главната страница. Определете главните секции на вашия сайт. Примерно, в adaptivepath.com, ние сме разделили сайта си на тези секции: team, services, workshops, publications и contact. Ако аз правех инвентаризация на този сайт, бих започнал с една от тези секции, ще кликна и ще видя какви връзки има по-нататък. За всяка страница, която посетя, бих записал информацията указана в колоните на таблицата. Бих проследил всяка връзка, бих разгледал толкова надълбоко из сайта, колкото мога, уверявайки се, че съм събрал информация за всяка възможна страница на сайта.

Ето описание за всяко от нещата, които гледам:

Примерна таблица в Excel.

  • Link ID (описание на връзката): Когато правим инвентаризация на съдържанието, ние създаваме система за номериране при предвижването си из сайта. Тя ни помага да се връщаме към конкретна секция или страница от сайта докато попълваме таблицата. В същата Excel таблица, ще видите, че "Products" е втората секция от сайта, която сме анализирали, а страниците под Product страницата са номерирани по съответния начин. Една такава система може да се окаже неоценима, когато по-късно се пишат функционалните или интерфейсните спецификации.
  • Link Name (име на връзката): Съдържанието, което преглеждате, трябва да бъде наименовано по някакъв начин. Обикновено за тази цел използваме заглавието на HTML документа или ако то не е достатъчно конкретен - водещото заглавие от съдържанието. Името трябва да бъде уникално и описателно.
  • Link (връзка): Записването на URL адреса на частта от съдържанието, което разглеждате в момента, може да бъде много полезно - не само, че ще можете да кликвате и да проследявате тези връзки от самата таблица, но освен това улавяте и каноничното (онова, което трябва да бъде) местоположение на документа в уеб сървъра. Запомнете, че URL трябва да сочи към реалния HTML файл, а не към страница за redirect или нещо подобно.
  • Document type (вид на документа): Какъв темплейт използва или трябва да използва страницата? Това страница за даден продукт ли е или пък с правна информация? Всеки сайт ще има има различен вид документи, но повечето имат по-малко от две дузини.
  • Topics, Keywords (Теми, Ключови думи): За какво се отнася съдържанието? Разгледайте кода на страницата и вижте какво - ако въобще - има нещо в “keywords” мета тага. В идеалния случай ще създадете контролен речник - колекция от утвърдени ключови думи, използвани за описание на съдържанието. Това не само помага при избирането на правилни описателни думи, но и поддържа метаданните ви в порядък. С един контролен речник, можете да избегнете ситуациите, при които половината от хората, създаващи съдържанието, наричат едно и също нещо веднъж “влак”, а друг път — “локомотив”. Можете да прочетете повече по този въпрос в IA-Wiki.
  • Owner, Maintainer (Собственик, Поддръжка): Кой е създал съдържанието? Кой го поддържа? Ако имате по-малък сайт, това може и да сте вие, така че можете да пренебрегнете това. В работата с корпоративните си клиенти ние определяме чия е отговорността за всяка част от информацията.
  • ROT (ИОТ): Този акроним идва от "Redundant, Outdated, or Trivial" (Излишно, Остаряло или Тривиално). Това е етикет, с който обозначаваме съдържанието, което вероятно трябва да се махне от сайта. Има ли някъде другаде копие на съдържанието? То все още ли е уместно / навременно? Може би никога не е трябвало да бъде публикувано? Ако вече не принадлежи към същия сайт, тук си отбележете това. Това са неща, които не трябва да се окажат в новата ви база данни.
  • Notes (Бележки): Всичко останало, което забележите. Тук можте да включите неща като липсващи изображения или други HTML проблеми. Опитайте се да запишете всичко, което искате да запомните за по-късно.

След като сте запълнили неколкостотин реда от таблицата, неизбежно ще започнете да се чудите дали няма нещо - каквото и да е!, - ускоряващо този процес. Все някоя технология би могла да ви дойде на помощ. Съжалявам. Най-доброто, което успяхме да направим, бе да вземем на помощ един програмист, който да напише скрипт, обхождащ всички страници на сайта и изплюващ във файл URL адресите, които намери. И това само частично ни подсигурява, че не сме изпуснали някоя страница. Дори и с тази помощ, ние винаги минаваме през страниците и ръчно. Инвентаризацията на съдържанието определено е задача, която се изпълнява от човек. Всъщност, намираме, че този процес често може да бъде също толкова ценен, колкото и самата финална таблица. Ако инвестирате време в пречистването на своя сайт и в разграждането на всяка страница (или поне една добра извадка от страниците), ще се превърнете в неоспорим експерт, знаещ идеално как са свързани нещата. А това е неоценимо знание, когато става въпрос за редизайна на вашия сайт.

Download: content_inventory_template.xls (34K Excel file)