Код

МЕТА тагове, robots.txt, llm.txt - пълно ръководство

От Георги Варзоновцев · 2026-06-13

Всичко за META таговете.

Всичко за META таговете — този път през 2026.

Предговор

Тази статия я писах за пръв път през 2003 година, когато най-големият проблем беше как да накараш кирилицата да не излиза като маймуница на екрана. Оттогава светът се смени два пъти. Кодовите таблици умряха, търсачките поумняха, появиха се социалните мрежи, а напоследък из мрежата обикалят и едни нови създания — AI агенти, които не просто индексират страниците, а ги четат, преразказват и цитират пред хора, които никога няма да видят сайта ти.

Затова реших да не кърпя старата статия, а да я напиша наново. Запазих същината — какво представляват META таговете и къде се разполагат — но изхвърлих всичко умряло и добавих това, което днес наистина има значение.

META таговете служат за указване на МЕТА информация — информация за самия документ, а не за неговото съдържание. Разполагат се между <head> и </head> в началото на HTML документа. През 2003 ги пишехме с главни букви и кавички както дойде; днес конвенцията е всичко с малки букви и винаги в двойни кавички.

Типичният META таг и днес изглежда така:

<meta name="author" content="Георги Варзоновцев">

Състои се от атрибут (name) и стойност (content). Дотук нищо не се е променило за 23 години. Промени се кои тагове са важни и кой ги чете.

Ще ги разделя на четири групи: задължителните, тези за социалните мрежи, тези за търсачките и AI агентите, и накрая — гробището, където погребваме тагове, на които някога разчитахме.

Задължителните

Това са трите тага, без които никой сериозен сайт не тръгва днес.

charset

Помниш ли цялата сага с Content-Type и charset=win-1251? Забрави я. Днес целият уеб е на UTF-8 и таговете се пишат по новия къс начин:

<meta charset="utf-8">

Това трябва да е първото нещо в <head>, преди всичко останало, защото браузърът трябва да знае с коя кодировка да чете останалата част от документа. UTF-8 покрива кирилица, латиница, емоджита и всичко между тях. Маймуните на екрана официално са история.

viewport

Този таг изобщо не съществуваше през 2003, защото нямаше телефони, на които да гледаш сайтове. Днес повече от половината трафик е мобилен и без този ред сайтът ти изглежда като намалена снимка на десктоп версия:

<meta name="viewport" content="width=device-width, initial-scale=1">

Казва на телефона да рисува страницата според ширината на екрана, а не да я свива. Без него цялата responsive магия не работи.

description

Единственият оцелял от старата статия, който и днес е важен — но по различна причина. Вече не влияе на класирането в търсачките, но търсачките и социалните мрежи го показват като кратко описание под заглавието в резултатите. Това е твоят рекламен текст в две изречения:

<meta name="description" content="Магазинът за портокали на Пешо — пресни цитруси, доставка в София.">

Дръж го между 120 и 160 символа. По-дълго и търсачката ще го отреже по средата.

За социалните мрежи

Това е цяла категория, която през 2003 нямаше как да съществува. Когато някой пусне линка ти във Facebook, LinkedIn, Slack, Discord или която и да е група, тези тагове определят как ще изглежда визитката с картинка, заглавие и описание. Без тях линкът ти е гол и грозен и никой не го цъка.

Open Graph

Стандартът, който измисли Facebook, но днес го разбират почти всички платформи. Префиксът е og: и се пише с атрибут property вместо name:

<meta property="og:title" content="Магазинът за портокали на Пешо">
<meta property="og:description" content="Пресни цитруси, доставка в София.">
<meta property="og:image" content="https://example.com/img/portokali.jpg">
<meta property="og:url" content="https://example.com/portokali">
<meta property="og:type" content="website">
<meta property="og:locale" content="bg_BG">

Картинката (og:image) е най-важната — тя заема най-много място във визитката. Препоръчителен размер е 1200×630 пиксела. Винаги давай пълен абсолютен адрес на картинката, не относителен — социалните мрежи не четат от твоя домейн контекст.

Twitter / X Cards

X (бившият Twitter) разбира Open Graph, но има и свои тагове за по-добър контрол. Достатъчен е този ред, за да получиш голяма визитка с картинка:

<meta name="twitter:card" content="summary_large_image">

Ако не зададеш twitter:title, twitter:image и прочее, X просто ползва Open Graph стойностите — затова на практика рядко ти трябват отделни Twitter тагове освен twitter:card.

Съвет: Не разчитай на догадки. Всяка платформа има debugger — Facebook

Sharing Debugger, LinkedIn Post Inspector — където пействаш линка и виждаш

точно как ще изглежда визитката, преди да я пуснеш наживо. Платформите кешират

агресивно, така че ако смениш картинката, мини през дебъгера да опресниш кеша.

За търсачките и AI агентите

Тук става интересно. През 2003 единственото, което чете страницата ти, бяха паяците на търсачките. Днес имаш три различни вида посетители-програми: класически паяци (Googlebot), AI паяци за трениране на модели (GPTBot, ClaudeBot, Google-Extended) и AI агенти, които посещават страницата в реално време, за да отговорят на въпрос на потребител (ChatGPT-User, Claude-User, PerplexityBot). Всеки иска различни инструкции.

robots (META тагът)

Контролира как търсачките третират конкретната страница. Пише се с малки букви, стойностите се разделят със запетая:

<meta name="robots" content="index, follow">

Най-полезните стойности и днес са същите като през 2003:

за визуални сайтове).

  • index / noindex — дали страницата да влезе в индекса.

  • follow / nofollow — дали да се проследяват връзките от нея.

  • noarchive — да не се пази кеширано копие.

  • max-image-preview:large — разрешава голяма картинка в резултатите (важно

  • max-snippet:-1 — без ограничение върху дължината на откъса.

Ако искаш инструкция само за определена търсачка, ползваш нейното име вместо robots — например <meta name="googlebot" content="noindex">.

Разликата, която всеки бърка: META robots vs robots.txt

META тагът robots живее вътре в страницата и казва на бота какво да прави с тази конкретна страница, след като я е изтеглил. Файлът robots.txt живее в корена на сайта (example.com/robots.txt) и казва на ботовете дали изобщо да влизат в дадени пътища, преди да теглят каквото и да е.

Просто правило: за да скриеш една страница от резултатите, ползвай noindex в META тага. За да управляваш достъпа на цели ботове до сайта, ползвай robots.txt.

AI агентите — какво наистина работи през 2026

Тук трябва да съм честен, защото мрежата е пълна със статии, които ти продават магия. Реалността през 2026:

META таговете не могат да спрат AI трениране. Няма META таг, който надеждно да каже „не тренирай модел с моето съдържание". Лостът, който наистина работи, е robots.txt с правила за конкретни ботове. Големите оператори — OpenAI, Anthropic, Google, Meta, Perplexity — публикуват имената на своите ботове и ги спазват (не по закон, а защото да те хванат, че ги нарушаваш, е PR катастрофа).

Типичната конфигурация днес разделя трениране от цитиране — блокираш ботовете, които смучат за трениране, но пускаш тези, които идват да цитират страницата ти пред потребител, защото това ти праща трафик:

# robots.txt — блокирай трениране, разреши цитиране
User-agent: GPTBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: Meta-ExternalAgent
Disallow: /

# но пусни агентите, които цитират на живо
User-agent: ChatGPT-User
Allow: /
User-agent: Claude-User
Allow: /
User-agent: PerplexityBot
Allow: /

А llms.txt? Сигурно си чел, че трябва да имаш llms.txt — markdown файл в корена, който подсказва на моделите кое е важното ти съдържание. Истината през 2026: голяма част от важните ботове още изобщо не го четат, а Google официално го сравни с умрелия keywords таг. Не вреди да го имаш, но не очаквай чудеса — това е залог с ниска цена и нисък добив. Истинският лост остава robots.txt.

Гробището

Тук погребваме таговете от оригиналната статия от 2003, на които вече не разчитай. Споменавам ги, защото ако си учил от старата версия — или намериш стар сайт — трябва да знаеш защо ги няма.

е <meta charset="utf-8">. Windows-1251 днес директно ще ти счупи сайта.

  • Content-Type с charset=win-1251 — мъртъв. Всичко е UTF-8, синтаксисът

ключови думи в META таг днес не помага с нищо за класирането. Чисто губене на байтове.

  • keywords — Google го игнорира от около 2009 заради спам. Да изброяваш

<html lang="bg">, не в META таг.

  • Content-Language като META таг — отпаднал. Езикът днес се указва на

ги пренебрегват. Кеширането се контролира с истински HTTP header-и от сървъра, не с META тагове. Старият трик с Expires="0" беше бъг и никога не е бил надежден.

  • Expires, Pragma, Cache-Control като META тагове — браузърите днес

Пренасочване се прави сървърно (301/302), а не като караш браузъра да презарежда.

  • Refresh — технически още работи, но е anti-pattern за достъпност и UX.

  • Главните букви (<META NAME="ROBOTS">) — не са грешка, но миришат на

  1. Конвенцията днес е всичко с малки.

Заключение

За 23 години META таговете минаха от „как да накарам кирилицата да работи" до „как да контролирам какво AI модел разказва за мен пред хора, които никога няма да посетят сайта ми". Същината обаче остана същата: META таговете са начин да кажеш на машините нещо за документа, което самият документ не казва.

Ако трябва да запомниш само пет реда, това са те:

<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1">
<meta name="description" content="...">
<meta property="og:image" content="https://...">
<meta name="twitter:card" content="summary_large_image">

Останалото е настройка според случая. А контролът върху AI ботовете — прави го в robots.txt, не тук.