Использование solr для индексирования различных типов данных

Я рассматриваю использование Apache solr для индексирования данных в новом проекте. Данные сделаны из разных независимых типов, что означает, например, что

  • растительные ингредиенты
  • животные
  • легковые автомобили
  • компьютеры

индексировать. Должен ли я использовать разные индексы для каждого из типов или имеет смысл использовать только один индекс? Как использование многих индексов влияет на производительность? Или есть ли другая возможность достичь этого?

Благодарю.

индексирование | люцен | solr |

1

Ответов: 1


Оба являются законными подходами, но есть компромиссы. Во-первых, насколько большой ваш набор данных? Если он достаточно велик, и вы можете разбить его на несколько серверов, вероятно, имеет смысл иметь разные индексы.

Во-вторых, насколько важна производительность - индексирование всего этого, вероятно, приведет к худшей производительности, но степень зависит от того, сколько данных есть и насколько сложны запросы.

В-третьих, вам нужно запрашивать несколько типов данных в одном и том же поиске? Если это так, индексирование всего вместе может быть удобным способом этого. Технически это может быть достигнуто с помощью отдельных индексов, но получение наиболее релевантных результатов для запроса может быть проблемой (а не тем, что это еще не так)

В-четвертых, один индекс с единой схемой и конфигурацией может упростить жизнь того, кто будет развертывать и поддерживать систему.

Еще одна вещь, которую следует учитывать, это идентификаторы - все ли разные объекты имеют уникальный идентификатор для всех типов? Если нет, вам, вероятно, понадобится создать это, если вы хотите проиндексировать их вместе.

индексирование | люцен | solr |

Ещё вопросы: | 45015367.php | | 20814959.php | | 45017238.php | | 45000788.php | | 45015761.php |

Яндекс.Метрика