Google использует разные типы хранилищ для страниц в индексе

В новом выпуске подкаста Search Off the Record сотрудник Google Гэри Илш рассказал, что поисковик использует разные типы хранилищ для страниц в своём индексе – это зависит от уровня индексирования.

Часть страниц хранится в более дешёвых хранилищах, часть – в более дорогих, которые позволяют быстрее получать к ним доступ.

Объясняя, как Google строит свой поисковый индекс, Илш рассказал, что индексируемый контент хранится в трёх типах хранилищ:

  • RAM – самый быстрый и самый дорогой вариант;
  • SSD – очень быстрый, но очень дорогой вариант;
  • HDD – самый медленный и самый дешёвый вариант.

Самое быстрое хранилище резервируется для тех документов, которые часто показываются в результатах поиска. Так, контент, доступ к которому осуществляется каждую секунду, хранится на RAM или SSD.  И это небольшая часть всего индекса Google.

Основная часть индекса хранится на жёстких дисках, поскольку они дешёвые, доступные и легко заменяемые.

Илш начал говорить об этом, начиная примерно с 7-й минуты подкаста.

Напомним, что в предыдущем выпуске Search Off the Record, который стал последним в 2020 году, сотрудники Google подвели итоги уходящего года и поделились своими планами на следующий год.

По материалам: searchengines.guru