Solr 101

Search engine/server/platform/whatevs
Written in Java
Open source, Apache 2.0 license
Runs as a Jetty or Tomcat servlet
Provides REST-ish HTTP API (XML or JSON)
Highly customizable via configuration, plugins
Also embeddable via EmbeddedSolrServer (although not considered a "best practice")

Two ways to get content in
- POST xml or json via HTTP
- DataImport: import from data source
Indexing process
- field-based
- Defined in schema.xml
- fieldType defines how field content is processed
- analysis phase: tokenize, filter, transform
- storage options: index only, index + content, term frequency, positions, normalizations, vectors
Inverted Index format: terms -> documents

via HTTP GET: "?q=term1"
default = Lucene query syntax
- free-form: term1 term2
- fielded: foo:term1
- phrases: "term1 term2"
- wildcards: "foo:term*"
- proximity: "term1 term2"~4
- ranges: [1 TO 1000]
ExtendedDisMax
- search across range of fields with varying "boost" factors
- title:foo^5 fulltext:bar^0.5

Demo!