Знакомство с Apache Solr™

Практика по информационному поиску

Опрос

  • Основы веб-технологий

  • Технический английский

  • Java

  • Командная строка

План:

  • Что такое Solr
  • История Apache Solr
  • Основные возможности
  • Почему Solr
  • Где скачать

Что такое Solr

Apache Solr - это платформа полнотекстового с открытым исходным кодом, основанная на проекте Apache Lucene

История Solr

  • 2004 г. - Йоник Сили (Yonik Seeley) создает Solr как внутренний проект CNET Networks
  • 2006 г. - CNET передает исходный код в Apache Software Foundation как проект, основанный на Lucene
  • 2007 г. - Solr был выведен из инкубационного статуса
  • 2010 г. - Lucene и Solr слиты в один проект и разрабатываются одной и той же командой разработчиков
  • 2011 г. - изменение схемы версионирования Solr, последующие версии Solr соответствуют версиям Lucene

Основные возможности

  • Полноценный полнотекстовый поиск на базе Lucene
  • Поддержка цитат, wildcards и многого другого
  • Высокая производительность
  • Кластеризация и устойчивость к сбоям "из коробки"
  • Полноценная админка и мониторинг "из коробки"
  • Поддержка стандартных интерфейсов - JSON, HTTP, XML
  • Относительная простота настройки

Сравнение поисковых движков по популярности

Компании, использующие Solr

  • Instagram
  • Reddit
  • Netflix
  • AOL
  • Goldman Sachs

  • Apple
  • eBay
  • Adobe
  • Disney
  • NASA
  • Ряд других: https://wiki.apache.org/solr/PublicServers

Где скачать

  • Официальное зеркало: http://bit.ly/getting-solr-4-10
  • Не забыть установить Java версии 1.7 или выше!
  • Установка: http://bit.ly/getting-started-solr-4-10

Information Retrieval Practice

By stdfx

Information Retrieval Practice

  • 716