Четвер, 28.03.2024
Програми,ігри,фільми,музика
[ Нові повідомлення · Учасники · Правила форуму · Пошук · RSS ]
  • Сторінка 1 з 1
  • 1
Форум » Форум » Розкручування сайтів » Як пошукові боти Індексують сайти
Як пошукові боти Індексують сайти
In_the_dark(Admin)Дата: Четвер, 22.07.2010, 21:28 | Сообщение # 1
Генералиссимус
Группа: Администраторы
Сообщений: 155
Награды: 2
Репутация: 101
Статус: Offline
Як пошукові боти Індекс сайту.

Отже. У відповідь на запит користувача бот видає результат пошуку. Шукає він у власному індексі. В індексі у нього лежать сайти в тому вигляді, в якому бот їх розуміє. У кожного бота це розуміння своє, але загальні риси простежуються.

Індекс утворюється двома шляхами.

Перший - web-маз сам просить бот проіндексіть його сайтец. Так чинять найчастіше з популярними і шанованими ботами. Для Рунета це: Яндекс, Рамблер і Апорт. Причому саме в такій послідовності. Хоча Рамблер з Яндексом змагаються в цьому плані. На решту боти можна не витрачати час. Це моя думка.

Другий шлях - боти самі у «вільне від роботи час» повзають по Інет і винюхують зміни. З новими сайтами вони надходять по різному. Найчастіше вони принюхуються до них якийсь час, а потім, якщо, на думку бота, з сторінкою все в порядку (відвідувачі іноді з'являються, спаму немає і ін) - вони його індекс. Тобто заносять інформацію про нього в свій індекс (базу даних).
Самий гальмівної в плані прінюхіванія - це Рамблер. Він принюхується по кілька місяців. Самий непрідірчівий - Яндекс. Можна створити лівий сайт і подивитися, як скоро він мимовільно з'явиться в тому чи іншому пошуковику. У Яндексі ... ну, через місяць-два.

Крім цього, боти стежать за станом свого індексу. Тобто за його відповідністю реальному стану справ в Інеті. Сайт може змінитися, зникнути й т.д. Тому боти його зазвичай Відновіть. Правда, можна заборонити це мета-тегами і цивілізовані боти не будуть цього робити.
Найшвидкісніший по реіндексірованію - Яндекс. Швидкість реіндекса - кілька днів, а то й частіше, якщо ресурс популярний. Самий гальмівної - Апарат. Швидкість реіндекса сторінок з відвідуваністю 50-100 хостів на добу - до півроку!
У мене був сайт, який переїхав. Так Апарат за запитом старий адресу ще кілька місяців видавав, хоча за цією адресою вже кілька місяців нічого не було! І відповідно, відвідуваність - 0. А Апарат все одно!

Далі.

Результат пошуку по запиту користувача найчастіше видається за релевантністю. Чим вище релевантність, тим вище позиція сторінки в результаті роботи пошукача. Сторінка з найбільш високою (на думку бота) релевантністю відображається першою. Релевантність - це ступінь відповідності вмісту індексу бота запиту користувача.
Наприклад, користувач вводить «анекдоти». Бот видає сторінки проіндексованих сайтів, де зустрічається це слово. Причому не просто зустрічається, а зустрічається в тих місцях, які бот індексів.
Але про це пізніше.
Яндекс, наприклад, найчастіше видає тільки одну сторінку з сайту та посилання на те, що є ще сторінки з того ж сервера. Чи помічали, напевно. Інші боти можуть по кілька сторінок з одного сервака на один запит видавати. Це не дуже освічені боти, але їх теж юзают.

Продовжимо з прикладом про «анекдоти». Бот видає результат пошуку за релевантністю. Тобто, якщо на сторінці є 100 слів і 4 з них - «анекдоти» (у називному відмінку, множині), то релевантність сторінки за запитом «анекдоти» 0.04. Чотири відсотки. Відповідно, якщо слів буде 10, і 4 з них - «анекдоти», то релевантність буде 40%. Тобто в 10 разів вище.
Це грубуватий приклад, оскільки слова в заголовку (те що між <title> </ title>) і в тексті сторінки мають для бота різну вагу, так само як слова в відмінку і числі, зазначеному в запиті і наявному на сторінці. Але для розуміння поняття «релевантність» цілком зійде.

Поясню про відмінки і числа.
Якщо запит «анекдот», а на сторінці зустрічаються лише слова «анектоТ, анекдот» і т.д. то релевантність сторінки за цим запитом буде нижче, ніж тих сторінок, на яких прямо написано слово «анекдот». Але в будь-якому випадку сторінка все одно знайдеться за запитом «анекдот» (але в с кінці списку відповіді пошукача).

Зі сказаного випливає, що сторінка повинна містити поменше слів, і слова повинні бути, в основному, ключові.

Куди ж подіти інфу, яка в 10-20 слів ніяк не поміститься?
Відповідь - сторінки з інфой та сторінки для пошукових роботів - це «дві великі різниці».

Сторінки з інфой-це ті сторінки, на які потрапляєш за посиланням зі стартової сторінки. А стартова сторінка (інші назви - індексний, заходная, doorway та ін) - це сторінка яка якраз і містить 10-20 слів (включаючи заголовок і мета-теги). Тобто ця сторінка, створена спеціально для бота. І більше ні для кого.

Зазвичай, на стартовій сторінці розміщують лого, іноді ще кілька слів - щоб користувач зрозумів, куди потрапив, і кнопочку «Вхід». Іноді замість кнопочки «вхід» - посилання на різні розділи сайту. Тобто кілька входів.
Якщо без тексту на індекс, ну, ніяк не обійтися, можна запхнути його в картинки. Так Мелкософт (www.microsoft.com) надходить, наприклад. Правда, їм-то чого про релевантністю дбати?

Важливо, щоб бот за запитом знайшов хоч якусь сторінку на сайті. Важливо також, щоб навігація на ВСІХ сторінках дозволяла потрапити в найкоротші терміни в будь-яке місце сайту.
Принаймні, посилання на головну сторінку, на мою думку, повинна стояти на кожній сторінці.
Якщо бот почне індекс, він надітий одну сторінку і далі піде по посиланнях на ній. Потрібно полегшити йому це завдання. Причому, чим більше посилань на ту чи іншу сторінку (з різних сторінок, ясний тітка), тим вище її «цінність» з точки зору бота.

Отже.
Стартова сторінка робиться для бота. На ній немає инфы, тільки посилання (посилання) і купа хитрощів (див. нижче) для заманюючи пошукових роботів.
Сторінки з інфой повинні містити посилання один на одного, нормальний інформативний заголовок і прийнятні мета-теги. Всі. Їх мета - дати інфу і не перешкоджати боту запхнути їх у свій індекс. Вони не повинні першими з'являтися за запитом користувача. Так як в даному випадку це якраз ті два зайця, за якими ніяк не наздогнати, та й не треба.

Далі.

Ясна річ, що є не одне, а кілька ключових слів, за якими web-маз хоче, щоб шукали сайт. Щоб цього добитися, по-хорошому, треба робити стільки стартових сторінок, скільки бажаних web-МАЗом ключових слів. Зовні ці сторінки нічим не повинні відрізнятися. Ну, може, title `ом. Відрізнятися повинна службова інфо, про яку мова піде нижче.

Наприклад, у мене є сайт для фірмешкі, що продає стартери для іномарок. Я зробила з десяток-два індексних сторінок для найбільш популярних моделей іномарок. Зовні сторінки відрізняються тільки тим, що на одній в заголовку написано «Стартери для Мерседеса», а на іншій - «Стартери для Вольво». Всі. Звичайно, відрізняються мета-теги, alt `и (підписи до картинок) і т.д. Про це нижче. Кожну індексний сторінку я індексу у ботах окремо.

Отже.
Що ж індекс бот?
У кожного бота свій характер, але в цілому приблизно так.
По-перше title. Це найважливіша частина. Слова в title `і мають найбільший вагу. Велику вагу мають слова в alt `ах (підписах до картинок), слова між <h1> </ h1>, <h2> </ h2> і т.д. в порядку убування значущості, слова між <b> </ b>.
Крім того, слова, розташовані ближче (вище) до title `у, мають більшу вагу, ніж слова розташовані нижче. Тобто, чим вище слово, тим вище його вага при визначенні релевантності.
Повнотекстові боти (тобто практично всі сучасні) індекси ще і сам текст. В основному, на предмет наявності в тексті слів, зазначених у заголовку і позначках. Але якщо тексту немає або дуже мало - відповідно.

 
Форум » Форум » Розкручування сайтів » Як пошукові боти Індексують сайти
  • Сторінка 1 з 1
  • 1
Пошук:

By Sergio Kyluk © 2024
Хостинг від uCoz