【架构实战】ElasticSearch搜索集群：全文检索的艺术

ã€æž¶æž„å®žæˆ˜ã€‘ElasticSearchæœç´¢é›†ç¾¤ï¼šå

¨æ–‡æ£€ç´¢çš„è‰ºæœ¯

å€’æŽ’ç´¢å¼•ã€åˆ†ç‰‡å‰¯æœ¬ã€æœç´¢ä¼˜åŒ–ã€å®žæˆ˜æ¡ˆä¾‹

ä¸€ã€ä»Žä¸€ä¸ªçœŸå®žçš„æ•

äº‹è¯´èµ·

2024å¹´åŒåä¸€ï¼ŒæŸç”µå•†å¹³å°æœç´¢ç³»ç»Ÿåœ¨æµé‡æ´ªå³°åˆ°æ¥çš„é‚£ä¸€åˆ»ï¼Œçªç„¶"å“‘ç«"äº†ã€‚

ç”¨æˆ·åœ¨æœç´¢æ¡†è¾“å
¥"iPhone 15 Pro Max"ï¼Œç‰äº†æ•´æ•´8ç§’ï¼Œé¡µé¢æ‰åˆ·å‡ºç»“æžœã€‚è€Œæ›´è¯¡å¼‚çš„æ˜¯ï¼Œæœ‰äº›ç”¨æˆ·æœç´¢"æ‰‹æœºå£³"ï¼Œå±
ç„¶æœå‡ºäº†"æ‰‹æœºæ”¯æž¶"â€”â€”ç›¸å
³æ€§å®Œå
¨é”™ä¹±ã€‚è¿ç»´å›¢é˜Ÿç´§æ€¥æŽ’æŸ¥ï¼Œå‘çŽ°æ˜¯ElasticSearché›†ç¾¤çš„æŸä¸ªåˆ†ç‰‡å› ä¸ºç£ç›˜IOç“¶é¢ˆå¯¼è‡´æŸ¥è¯¢è¶
æ—¶ï¼Œè€Œå‰¯æœ¬åˆ†ç‰‡å› ä¸ºè´Ÿè½½å‡è¡¡ç–ç•¥é—®é¢˜ï¼Œå
¨éƒ¨æ‰“åœ¨äº†åŒä¸€å°æœºå™¨ä¸Šã€‚

"æˆ‘ä»¬ä¸æ˜¯é
ç½®äº†å‰¯æœ¬å—ï¼Ÿä¸ºä»€ä¹ˆè¿˜ä¼šè¿™æ ·ï¼Ÿ"å¼€å‘åŒå¦ä¸€è„¸æ‡µã€‚

"å‰¯æœ¬æ˜¯é
ç½®äº†ï¼Œä½†ä½ ä»¬æŠŠ5ä¸ªå‰¯æœ¬åˆ†ç‰‡å
¨éƒ¨åˆ†é
åˆ°äº†åŒä¸€å°é«˜é
æœºå™¨ä¸Šï¼Œä»¥ä¸ºè¿™æ ·èƒ½æé«˜æ€§èƒ½ã€‚ç»“æžœé‚£å°æœºå™¨çš„ç£ç›˜IOè¢«æ‰“æ»¡ï¼ŒæŸ¥è¯¢å
¨éƒ¨è¶
æ—¶ã€‚"è¿ç»´åŒå¦æ— å¥ˆåœ°è§£é‡Šã€‚

è¿™ä¸ªæ•
äº‹å‘Šè¯‰æˆ‘ä»¬ï¼šElasticSearchä¸æ˜¯å¼€ç®±å³ç”¨çš„æœç´¢å¼•æ“Žï¼Œç†è§£å ¶åº•å±‚åŽŸç†å¹¶æ£ç¡®é ç½®ï¼Œæ‰èƒ½çœŸæ£å‘æŒ¥å®ƒçš„å¨åŠ›ã€‚

äºŒã€æ ¸å¿ƒæ¦‚å¿µï¼šå€’æŽ’ç´¢å¼•â€”â€”æœç´¢çš„åŸºçŸ³

2.1 ä»€ä¹ˆæ˜¯å€’æŽ’ç´¢å¼•ï¼Ÿ

ä¼ ç»Ÿçš„å
³ç³»åž‹æ•°æ®åº“ä½¿ç”¨**æ£å‘ç´¢å¼•**ï¼šæ–‡æ¡£ID â†’ æ–‡æ¡£å†
å®¹ã€‚æ¯”å¦‚ï¼š

1æ–‡æ¡£ID: 1 â†’ å†
2å®¹: "iPhone 15 Pro Max 256GB æ·±ç©ºé»‘"
3æ–‡æ¡£ID: 2 â†’ å†
4å®¹: "iPhone 15 Pro æ‰‹æœºå£³ é€æ˜Ž"
5æ–‡æ¡£ID: 3 â†’ å†
6å®¹: "iPhone 14 Pro Max æ‰‹æœºå£³ é»‘è‰²"
7

å¦‚æžœè¦æœç´¢"iPhone"ï¼Œæ•°æ®åº“éœ€è¦æ‰«ææ‰€æœ‰æ–‡æ¡£ï¼Œé€ä¸ªåŒ¹é
â€”â€”è¿™å°±æ˜¯å ¨è¡¨æ‰«æï¼Œæ•ˆçŽ‡æžä½Žã€‚

è€ŒElasticSearchä½¿ç”¨**å€’æŽ’ç´¢å¼•**ï¼šè¯æ¡ â†’ æ–‡æ¡£IDåˆ—è¡¨ã€‚

1è¯æ¡          æ–‡æ¡£IDåˆ—è¡¨
2â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€â”€
3iPhone       â†’ [1, 2, 3]
415           â†’ [1, 2]
5Pro          â†’ [1, 2, 3]
6Max          â†’ [1, 3]
7æ‰‹æœºå£³       â†’ [2, 3]
8256GB        â†’ [1]
9æ·±ç©ºé»‘       â†’ [1]
10é€æ˜Ž         â†’ [2]
11é»‘è‰²         â†’ [3]
12

çŽ°åœ¨æœç´¢"iPhone"ï¼Œåªéœ€è¦åœ¨å€’æŽ’ç´¢å¼•ä¸æ‰¾åˆ°"iPhone"è¿™ä¸ªè¯æ¡ï¼Œç›´æŽ¥å¾—åˆ°æ–‡æ¡£IDåˆ—è¡¨[1, 2, 3]ï¼Œæ— éœ€æ‰«æä»»ä½•æ–‡æ¡£ã€‚è¿™å°±æ˜¯**O(1)çº§åˆ«**çš„æŸ¥è¯¢æ•ˆçŽ‡ã€‚

2.2 å€’æŽ’ç´¢å¼•çš„ç»“æž„

å€’æŽ’ç´¢å¼•ç”±ä¸‰ä¸ªæ ¸å¿ƒç»“æž„ç»„æˆï¼š

Term Dictionaryï¼ˆè¯æ¡å—å
**¸ï¼‰**ï¼šæ‰€æœ‰ä¸é‡å¤çš„è¯æ¡ï¼ŒæŒ‰å—å
¸åºæŽ’åºã€‚ElasticSearchä½¿ç”¨FSTï¼ˆFinite State Transducerï¼‰åŽ‹ç¼©å˜å‚¨ï¼Œå†
å˜å ç”¨æžå°ã€‚
**Term Indexï¼ˆè¯æ¡ç´¢å¼•ï¼‰**ï¼šTerm Dictionaryçš„ç´¢å¼•ï¼Œç”¨äºŽå¿«é€Ÿå®šä½è¯æ¡åœ¨ç£ç›˜ä¸Šçš„ä½ç½®ã€‚é€šå¸¸æ¯128ä¸ªè¯æ¡å»ºç«‹ä¸€ä¸ªç´¢å¼•é¡¹ã€‚
**Posting Listï¼ˆå€’æŽ’è¡¨ï¼‰**ï¼šæ¯ä¸ªè¯æ¡å¯¹åº”çš„æ–‡æ¡£IDåˆ—è¡¨ã€‚ElasticSearchä½¿ç”¨Frame of Referenceç¼–ç å’ŒRoaring BitmapsåŽ‹ç¼©ï¼Œå¤§å¹
å‡å°‘å˜å‚¨ç©ºé—´ã€‚

1Term Index (å†
2å˜) â†’ Term Dictionary (ç£ç›˜) â†’ Posting List (ç£ç›˜)
3     â†“                    â†“                      â†“
4   å¿«é€Ÿå®šä½            è¯æ¡è¯¦æƒ
5              æ–‡æ¡£IDåˆ—è¡¨
6

2.3 å®žæˆ˜ï¼šæŸ¥çœ‹å€’æŽ’ç´¢å¼•

æˆ‘ä»¬å¯ä»¥é€šè¿‡ElasticSearchçš„_termvectorsAPIæŸ¥çœ‹æŸä¸ªæ–‡æ¡£çš„å€’æŽ’ç´¢å¼•ä¿¡æ¯ï¼š

1GET /products/_termvectors/1?fields=name&term_statistics=true
2
3{
4  "term_vectors": {
5    "name": {
6      "terms": {
7        "iphone": {
8          "term_freq": 1,
9          "doc_freq": 3,
10          "ttf": 3
11        },
12        "15": {
13          "term_freq": 1,
14          "doc_freq": 2,
15          "ttf": 2
16        }
17      }
18    }
19  }
20}
21

å
¶ä¸ï¼š

term_freqï¼šè¯¥è¯æ¡åœ¨å½“å‰æ–‡æ¡£ä¸å‡ºçŽ°çš„æ¬¡æ•°
doc_freqï¼šåŒ
å«è¯¥è¯æ¡çš„æ–‡æ¡£æ•°é‡ï¼ˆæ–‡æ¡£é¢‘çŽ‡ï¼‰
ttfï¼šè¯¥è¯æ¡åœ¨æ‰€æœ‰æ–‡æ¡£ä¸å‡ºçŽ°çš„æ€»æ¬¡æ•°

ä¸‰ã€åˆ†ç‰‡ä¸Žå‰¯æœ¬ï¼šåˆ†å¸ƒå¼çš„è‰ºæœ¯

3.1 åˆ†ç‰‡ï¼ˆShardï¼‰ï¼šæ•°æ®çš„æ°´å¹³åˆ‡åˆ†

ElasticSearchå°†ä¸€ä¸ªç´¢å¼•çš„æ•°æ®åˆ†æ•£åˆ°å¤šä¸ªåˆ†ç‰‡ä¸ï¼Œæ¯ä¸ªåˆ†ç‰‡æ˜¯ä¸€ä¸ªç‹¬ç«‹çš„Luceneç´¢å¼•ã€‚

ä¸ºä»€ä¹ˆéœ€è¦åˆ†ç‰‡ï¼Ÿ

**æ°´å¹³æ‰©å±•**ï¼šå•å°æœºå™¨å˜ä¸ä¸‹æµ·é‡æ•°æ®ï¼Œåˆ†ç‰‡è®©æ•°æ®åˆ†æ•£åˆ°å¤šå°æœºå™¨
**å¹¶è¡ŒæŸ¥è¯¢**ï¼šæŸ¥è¯¢å¯ä»¥å¹¶è¡Œæ‰§è¡Œåœ¨å¤šä¸ªåˆ†ç‰‡ä¸Šï¼Œæé«˜æ€§èƒ½

åˆ†ç‰‡æ•°é‡å¦‚ä½•ç¡®å®šï¼Ÿ

å®˜æ–¹å»ºè®®ï¼š**æ¯ä¸ªåˆ†ç‰‡å¤§å°åœ¨10GB-50GBä¹‹é—´**ï¼Œåˆ†ç‰‡æ•°é‡ = æ•°æ®æ€»é‡ / 30GBã€‚

1// åˆ›å»ºç´¢å¼•æ—¶æŒ‡å®šåˆ†ç‰‡æ•°
2PUT /products
3{
4  "settings": {
5    "number_of_shards": 5,
6    "number_of_replicas": 1
7  }
8}
9

3.2 å‰¯æœ¬ï¼ˆReplicaï¼‰ï¼šé«˜å¯ç”¨çš„ä¿éšœ

å‰¯æœ¬æ˜¯åˆ†ç‰‡çš„æ‹·è´ï¼Œç”¨äºŽï¼š

å®¹ç¾ï¼šä¸»åˆ†ç‰‡æ•
éšœæ—¶ï¼Œå‰¯æœ¬è‡ªåŠ¨å‡çº§ä¸ºä¸»åˆ†ç‰‡
**è´Ÿè½½å‡è¡¡**ï¼šæŸ¥è¯¢è¯·æ±‚å¯ä»¥åˆ†å‘åˆ°å‰¯æœ¬ä¸Šï¼Œæé«˜æŸ¥è¯¢åžåé‡

å‰¯æœ¬æ•°é‡å¦‚ä½•ç¡®å®šï¼Ÿ

å¼€å‘çŽ¯å¢ƒï¼š0ä¸ªå‰¯æœ¬ï¼ˆèŠ‚çœèµ„æºï¼‰
ç”Ÿäº§çŽ¯å¢ƒï¼šè‡³å°‘1ä¸ªå‰¯æœ¬
é«˜å¯ç”¨åœºæ™¯ï¼š2ä¸ªå‰¯æœ¬ï¼ˆå
è®¸ä»»æ„2å°æœºå™¨åŒæ—¶æ•
éšœï¼‰

3.3 åˆ†ç‰‡åˆ†é

ç–ç•¥

ElasticSearché€šè¿‡åˆ†ç‰‡åˆ†é **å™¨ï¼ˆShard Allocatorï¼‰**å†³å®šåˆ†ç‰‡æ”¾åœ¨å“ªäº›èŠ‚ç‚¹ä¸Šã€‚æ ¸å¿ƒåŽŸåˆ™ï¼š

**å‡è¡¡åŽŸåˆ™**ï¼šå°½é‡è®©æ¯ä¸ªèŠ‚ç‚¹çš„åˆ†ç‰‡æ•°é‡ç›¸è¿‘
**æ„ŸçŸ¥åŽŸåˆ™**ï¼šé¿å
ä¸»åˆ†ç‰‡å’Œå‰¯æœ¬åˆ†ç‰‡åˆ†é
åˆ°åŒä¸€å°æœºå™¨
**å±žæ€§æ„ŸçŸ¥**ï¼šå¯ä»¥æ ¹æ®æœºæž¶ã€å¯ç”¨åŒºç‰å±žæ€§åˆ†é
ï¼Œé¿å
å•ç‚¹æ•
éšœ

1# elasticsearch.yml é
2ç½®æœºæž¶æ„ŸçŸ¥
3cluster.routing.allocation.awareness.attributes: rack_id
4
5node.attr.rack_id: rack1  # èŠ‚ç‚¹1
6node.attr.rack_id: rack2  # èŠ‚ç‚¹2
7

è¿™æ ·é
ç½®åŽï¼ŒElasticSearchä¼šå°½é‡å°†ä¸»åˆ†ç‰‡å’Œå‰¯æœ¬åˆ†ç‰‡åˆ†é
åˆ°ä¸åŒçš„æœºæž¶ä¸Šã€‚

3.4 å®žæˆ˜æ¡ˆä¾‹ï¼šåˆ†ç‰‡åˆ†é

å¤±è´¥æŽ’æŸ¥

**é—®é¢˜çŽ°è±¡**ï¼šé›†ç¾¤çŠ¶æ€ä¸ºYellowï¼Œæç¤º"åˆ†ç‰‡åˆ†é
å¤±è´¥"ã€‚

**æŽ’æŸ¥æ¥éª¤**ï¼š

1// 1. æŸ¥çœ‹é›†ç¾¤å¥åº·çŠ¶æ€
2GET /_cluster/health
3
4{
5  "status": "yellow",
6  "unassigned_shards": 2
7}
8
9// 2. æŸ¥çœ‹åˆ†ç‰‡åˆ†é
10è§£é‡Š
11GET /_cluster/allocation/explain
12
13{
14  "index": "products",
15  "shard": 1,
16  "primary": false,
17  "current_state": "unassigned",
18  "unassigned_info": {
19    "reason": "NODE_LEFT",
20    "at": "2024-11-11T10:00:00.000Z"
21  },
22  "can_allocate": "no",
23  "allocate_explanation": "cannot allocate because the node left the cluster"
24}
25

è§£å†³æ–¹æ¡ˆï¼š

å¦‚æžœæ˜¯èŠ‚ç‚¹ä¸´æ—¶æ•
éšœï¼Œç‰å¾
èŠ‚ç‚¹æ¢å¤å³å¯ã€‚å¦‚æžœèŠ‚ç‚¹æ°¸ä¹
ä¸‹çº¿ï¼Œéœ€è¦è°ƒæ•´åˆ†ç‰‡åˆ†é
ç–ç•¥ï¼š

1// é‡æ–°åˆ†é
2å‰¯æœ¬
3POST /_cluster/reroute?retry_failed=true
4

å››ã€æœç´¢ä¼˜åŒ–ï¼šä»Žå

¥é—¨åˆ°ç²¾é€š

4.1 æŸ¥è¯¢DSLï¼šæž„å»ºå¤æ‚æŸ¥è¯¢

ElasticSearchæä¾›äº†å¼ºå¤§çš„Query DSLï¼ˆDomain Specific Languageï¼‰ï¼š

1// boolç»„åˆæŸ¥è¯¢
2GET /products/_search
3{
4  "query": {
5    "bool": {
6      "must": [
7        { "match": { "name": "iPhone" }}
8      ],
9      "should": [
10        { "match": { "brand": "Apple" }},
11        { "range": { "price": { "lte": 10000 }}}
12      ],
13      "must_not": [
14        { "match": { "status": "ä¸‹æž¶" }}
15      ],
16      "filter": [
17        { "term": { "category": "æ‰‹æœº" }}
18      ]
19    }
20  }
21}
22

å
¶ä¸ï¼š

mustï¼šå¿
é¡»åŒ¹é
ï¼Œå‚ä¸Žè¯„åˆ†
shouldï¼šé€‰æ‹©æ€§åŒ¹é
ï¼Œå‚ä¸Žè¯„åˆ†
must_notï¼šå¿
é¡»ä¸åŒ¹é
ï¼Œä¸å‚ä¸Žè¯„åˆ†
filterï¼šå¿
é¡»åŒ¹é
ï¼Œä¸å‚ä¸Žè¯„åˆ†ï¼ˆæ€§èƒ½æ›´é«˜ï¼‰

4.2 ç›¸å

³æ€§è¯„åˆ†ï¼šBM25ç®—æ³•

ElasticSearché»˜è®¤ä½¿ç”¨BM25ç®—æ³•è®¡ç®—æ–‡æ¡£ç›¸å
³æ€§è¯„åˆ†ï¼š

1score(D, Q) = Î£ IDF(qi) * (f(qi, D) * (k1 + 1)) / (f(qi, D) + k1 * (1 - b + b * |D| / avgdl))
2

å
¶ä¸ï¼š

f(qi, D)ï¼šè¯æ¡qiåœ¨æ–‡æ¡£Dä¸çš„å‡ºçŽ°é¢‘çŽ‡
|D|ï¼šæ–‡æ¡£Dçš„é•¿åº¦
avgdlï¼šæ‰€æœ‰æ–‡æ¡£çš„å¹³å‡é•¿åº¦
k1ã€bï¼šè°ƒèŠ‚å‚æ•°ï¼Œé»˜è®¤k1=1.2ï¼Œb=0.75

å®žæˆ˜ï¼šè°ƒæ•´BM25å‚æ•°

1PUT /products
2{
3  "settings": {
4    "index": {
5      "similarity": {
6        "custom_bm25": {
7          "type": "BM25",
8          "k1": 1.5,
9          "b": 0.8
10        }
11      }
12    }
13  },
14  "mappings": {
15    "properties": {
16      "name": {
17        "type": "text",
18        "similarity": "custom_bm25"
19      }
20    }
21  }
22}
23

4.3 é«˜äº®æ˜¾ç¤ºï¼šè®©ç»“æžœæ›´ç›´è§‚

1GET /products/_search
2{
3  "query": {
4    "match": { "name": "iPhone" }
5  },
6  "highlight": {
7    "fields": {
8      "name": {
9        "pre_tags": ["<em>"],
10        "post_tags": ["</em>"],
11        "fragment_size": 150,
12        "number_of_fragments": 3
13      }
14    }
15  }
16}
17
18// è¿”å›žç»“æžœ
19{
20  "hits": {
21    "hits": [
22      {
23        "_source": {
24          "name": "iPhone 15 Pro Max 256GB æ·±ç©ºé»‘"
25        },
26        "highlight": {
27          "name": ["<em>iPhone</em> 15 Pro Max 256GB æ·±ç©ºé»‘"]
28        }
29      }
30    ]
31  }
32}
33

4.4 èšåˆåˆ†æžï¼šä¸åªæ˜¯æœç´¢

ElasticSearchçš„èšåˆåŠŸèƒ½å¯ä»¥å®žçŽ°å¤æ‚çš„æ•°æ®åˆ†æžï¼š

1// æŒ‰å“ç‰Œåˆ†ç»„ï¼Œè®¡ç®—å¹³å‡ä»·æ ¼å’Œé”€é‡
2GET /products/_search
3{
4  "size": 0,
5  "aggs": {
6    "brands": {
7      "terms": { "field": "brand.keyword", "size": 10 },
8      "aggs": {
9        "avg_price": { "avg": { "field": "price" }},
10        "total_sales": { "sum": { "field": "sales" }}
11      }
12    }
13  }
14}
15

äº”ã€å®žæˆ˜æ¡ˆä¾‹ï¼šç”µå•†æœç´¢ç³»ç»Ÿæž¶æž„

5.1 ç³»ç»Ÿæž¶æž„è®¾è®¡

1ç”¨æˆ·è¯·æ±‚
2    â†“
3APIç½‘å
4³ï¼ˆé™æµã€é‰´æƒï¼‰
5    â†“
6æœç´¢æœåŠ¡ï¼ˆæŸ¥è¯¢é‡å†™ã€ç»“æžœæŽ’åºï¼‰
7    â†“
8ElasticSearché›†ç¾¤ï¼ˆ3ä¸»3ä»Žï¼‰
9    â†“
10æ•°æ®åŒæ¥æœåŠ¡ï¼ˆMySQL â†’ ESï¼‰
11

5.2 æ•°æ®åŒæ¥æ–¹æ¡ˆ

æ–¹æ¡ˆä¸€ï¼šåŒå†™æ¨¡å¼

åº”ç”¨å±‚åŒæ—¶å†™å
¥MySQLå’ŒElasticSearchï¼š

1@Transactional
2public void saveProduct(Product product) {
3    // 1. å†™å
4¥MySQL
5    productMapper.insert(product);
6    
7    // 2. å†™å
8¥ElasticSearch
9    try {
10        elasticsearchTemplate.save(product);
11    } catch (Exception e) {
12        // å†™å
13¥å¤±è´¥ï¼Œè®°å½•æ—¥å¿—ï¼Œå¼‚æ¥è¡¥å¿
14        log.error("ESå†™å
15¥å¤±è´¥", e);
16        mqService.send("es_sync_topic", product);
17    }
18}
19

ä¼˜ç‚¹ï¼šå®žçŽ°ç®€å•ï¼Œå®žæ—¶æ€§é«˜
ç¼ºç‚¹ï¼šä»£ç ä¾µå
¥æ€§å¼ºï¼Œä¸€è‡´æ€§éš¾ä»¥ä¿è¯

æ–¹æ¡ˆäºŒï¼šCDCï¼ˆChange Data Captureï¼‰

é€šè¿‡ç›‘å¬MySQLçš„binlogï¼Œå®žæ—¶åŒæ¥åˆ°ElasticSearchï¼š

1# Canalé
2ç½®
3canal.instance.master.address: 127.0.0.1:3306
4canal.instance.filter.regex: shop\\.products
5
6# åŒæ¥åˆ°ES
7canal.adapters:
8  - name: es
9    hosts: 127.0.0.1:9200
10    index: products
11    mapping:
12      id: _id
13      name: name
14      price: price
15

ä¼˜ç‚¹ï¼šä»£ç æ— ä¾µå
¥ï¼Œä¸€è‡´æ€§æœ‰ä¿éšœ
ç¼ºç‚¹ï¼šéœ€è¦é¢å¤–éƒ¨ç½²Canalï¼Œè¿ç»´æˆæœ¬é«˜

5.3 æœç´¢æ€§èƒ½ä¼˜åŒ–

ä¼˜åŒ–ä¸€ï¼šä½¿ç”¨filterä»£æ›¿query

1// æ
2¢ï¼šä½¿ç”¨query
3GET /products/_search
4{
5  "query": {
6    "bool": {
7      "must": [
8        { "term": { "category": "æ‰‹æœº" }},
9        { "term": { "brand": "Apple" }}
10      ]
11    }
12  }
13}
14
15// å¿«ï¼šä½¿ç”¨filter
16GET /products/_search
17{
18  "query": {
19    "bool": {
20      "filter": [
21        { "term": { "category": "æ‰‹æœº" }},
22        { "term": { "brand": "Apple" }}
23      ]
24    }
25  }
26}
27

filterä¸è®¡ç®—è¯„åˆ†ï¼Œä¸”ä¼šè¢«ç¼“å˜ï¼Œæ€§èƒ½æ›´é«˜ã€‚

ä¼˜åŒ–äºŒï¼šé¢„çƒç¼“å˜

åœ¨ä¸šåŠ¡ä½Žå³°æœŸé¢„çƒæŸ¥è¯¢ç¼“å˜ï¼š

1@Scheduled(cron = "0 0 3 * * ?")
2public void warmUpCache() {
3    List<String> hotKeywords = getHotKeywords();
4    for (String keyword : hotKeywords) {
5        elasticsearchTemplate.query(keyword);
6    }
7}
8

ä¼˜åŒ–ä¸‰ï¼šå¼‚æ¥æŸ¥è¯¢

å¯¹äºŽéžæ ¸å¿ƒæŸ¥è¯¢ï¼ˆå¦‚æŽ¨èã€å¹¿å‘Šï¼‰ï¼Œä½¿ç”¨å¼‚æ¥æŸ¥è¯¢ï¼š

1CompletableFuture<List<Product>> recommendFuture = CompletableFuture.supplyAsync(() -> {
2    return recommendService.query(userId);
3});
4
5CompletableFuture<List<Ad>> adFuture = CompletableFuture.supplyAsync(() -> {
6    return adService.query(userId);
7});
8
9// ç‰å¾
10æ‰€æœ‰æŸ¥è¯¢å®Œæˆ
11CompletableFuture.allOf(recommendFuture, adFuture).join();
12

å

ã€è¸©å‘å®žå½•

**é—®é¢˜**ï¼šæŸ¥è¯¢ç¬¬10000é¡µï¼Œæ¯é¡µ10æ¡ï¼Œè€—æ—¶10ç§’ã€‚

1GET /products/_search
2{
3  "from": 100000,
4  "size": 10,
5  "query": { "match_all": {} }
6}
7

**åŽŸå› **ï¼šElasticSearchéœ€è¦æŸ¥è¯¢æ‰€æœ‰åˆ†ç‰‡çš„from+sizeæ¡æ•°æ®ï¼Œåœ¨åè°ƒèŠ‚ç‚¹æŽ’åºåŽå–[from, from+size]ã€‚fromè¶Šå¤§ï¼ŒæŽ’åºçš„æ•°æ®è¶Šå¤šï¼Œæ€§èƒ½è¶Šå·®ã€‚

è§£å†³æ–¹æ¡ˆï¼šä½¿ç”¨search_afterä»£æ›¿from/sizeï¼š

1// ç¬¬ä¸€æ¬¡æŸ¥è¯¢
2GET /products/_search
3{
4  "size": 10,
5  "sort": [
6    { "_id": "asc" }
7  ]
8}
9
10// åŽç»æŸ¥è¯¢
11GET /products/_search
12{
13  "size": 10,
14  "sort": [
15    { "_id": "asc" }
16  ],
17  "search_after": ["AVd3d3d3d3d3d3d3"]
18}
19

**é—®é¢˜**ï¼šå¯¹priceå—æ®µèšåˆæ—¶æŠ¥é”™ã€‚

1GET /products/_search
2{
3  "aggs": {
4    "price_stats": { "stats": { "field": "price" }}
5  }
6}
7
8// æŠ¥é”™
9{
10  "error": {
11    "type": "illegal_argument_exception",
12    "reason": "Field [price] of type [text] is not supported for aggregation"
13  }
14}
15

**åŽŸå› **ï¼špriceå—æ®µè¢«æ˜ å°„ä¸ºtextç±»åž‹ï¼Œtextç±»åž‹ä¸æ”¯æŒèšåˆã€‚

è§£å†³æ–¹æ¡ˆï¼šä½¿ç”¨keywordç±»åž‹æˆ–æ·»åŠ åå—æ®µï¼š

1PUT /products/_mapping
2{
3  "properties": {
4    "price": {
5      "type": "text",
6      "fields": {
7        "keyword": { "type": "keyword" },
8        "double": { "type": "double" }
9      }
10    }
11  }
12}
13
14// ä½¿ç”¨åå—æ®µèšåˆ
15GET /products/_search
16{
17  "aggs": {
18    "price_stats": { "stats": { "field": "price.double" }}
19  }
20}
21

**é—®é¢˜**ï¼šé›†ç¾¤å‡ºçŽ°ä¸¤ä¸ªMasterèŠ‚ç‚¹ï¼Œæ•°æ®ä¸ä¸€è‡´ã€‚

**åŽŸå› **ï¼šç½‘ç»œåˆ†åŒºå¯¼è‡´éƒ¨åˆ†èŠ‚ç‚¹æ— æ³•é€šä¿¡ï¼Œå„è‡ªé€‰ä¸¾å‡ºMasterã€‚

è§£å†³æ–¹æ¡ˆï¼š

1# elasticsearch.yml
2# è®¾ç½®æœ€å°ä¸»èŠ‚ç‚¹æ•° = èŠ‚ç‚¹æ•°/2 + 1
3discovery.zen.minimum_master_nodes: 2
4
5# æˆ–è€
6ä½¿ç”¨7.x+ç‰ˆæœ¬çš„è‡ªåŠ¨é
7ç½®
8cluster.initial_master_nodes: ["node1", "node2", "node3"]
9

å˜è®¾ç½®ä¸å½“

**é—®é¢˜**ï¼šé¢‘ç¹Full GCï¼ŒæŸ¥è¯¢è¶
æ—¶ã€‚

è§£å†³æ–¹æ¡ˆï¼š

1# jvm.options
2-Xms16g
3-Xmx16g
4
5# å †å†
6å˜ä¸è¶
7è¿‡ç‰©ç†å†
8å˜çš„50%ï¼Œä¸”ä¸è¶
9è¿‡32GB
10# Luceneåˆ©ç”¨æ“ä½œç³»ç»Ÿçš„Page CacheåŠ é€ŸæŸ¥è¯¢ï¼Œå †å†
11å˜è¿‡å¤§åè€Œå½±å“æ€§èƒ½
12

ä¸ƒã€æ€»ç»“

ElasticSearchä½œä¸ºåˆ†å¸ƒå¼æœç´¢å¼•æ“Žï¼Œå
¶æ ¸å¿ƒä¼˜åŠ¿åœ¨äºŽï¼š

**å€’æŽ’ç´¢å¼•**ï¼šO(1)çº§åˆ«çš„æŸ¥è¯¢æ•ˆçŽ‡
ä¸°å¯Œçš„æŸ¥è¯¢DSLï¼šæ”¯æŒå¤æ‚æŸ¥è¯¢å’Œèšåˆåˆ†æž
**åˆ†å¸ƒå¼æž¶æž„**ï¼šè‡ªåŠ¨åˆ†ç‰‡åˆ†é
å’Œæ•
éšœæ¢å¤

ä½†åŒæ—¶ï¼ŒElasticSearchä¹Ÿæœ‰å
¶å¤æ‚æ€§ï¼š

**åˆ†ç‰‡è§„åˆ’**ï¼šåˆ†ç‰‡æ•°é‡å’Œå¤§å°éœ€è¦åˆç†è§„åˆ’
**æ€§èƒ½ä¼˜åŒ–**ï¼šæ·±åº¦åˆ†é¡µã€å—æ®µç±»åž‹ã€JVMé
ç½®ç‰éƒ½éœ€è¦æ·±å
¥ç†è§£
**è¿ç»´å¤æ‚åº¦**ï¼šé›†ç¾¤ç›‘æŽ§ã€æ•
éšœæŽ’æŸ¥ã€å®¹é‡è§„åˆ’éƒ½éœ€è¦ä¸“ä¸šèƒ½åŠ›

å

«ã€æ€è€ƒé¢˜

å¦‚æžœä½ çš„ä¸šåŠ¡éœ€è¦æ”¯æŒ"æœç´¢æŽ¨è"ï¼ˆç”¨æˆ·è¾“å
¥æ—¶å®žæ—¶æŽ¨èæœç´¢è¯ï¼‰ï¼Œä½ ä¼šå¦‚ä½•è®¾è®¡ï¼Ÿéœ€è¦è€ƒè™‘å“ªäº›æŠ€æœ¯ç‚¹ï¼Ÿ
ElasticSearchå’ŒMySQLå„æœ‰ä¼˜åŠ£ï¼Œä»€ä¹ˆåœºæ™¯ä¸‹åº”è¯¥é€‰æ‹©ElasticSearchä½œä¸ºä¸»å˜å‚¨ï¼Ÿä»€ä¹ˆåœºæ™¯ä¸‹åº”è¯¥ä¿æŒMySQLä¸ºä¸»å˜å‚¨ï¼ŒElasticSearchä»
ä½œä¸ºæœç´¢åŠ é€Ÿï¼Ÿ

ä¹ã€ä¸ªäººè§‚ç‚¹

åœ¨æˆ‘å‚ä¸Žè¿‡çš„å¤šä¸ªé¡¹ç›®ä¸ï¼ŒElasticSearchæœ€å¸¸è§çš„è¯¯åŒºæ˜¯ï¼š**æŠŠå®ƒå½“ä½œæ•°æ®åº“æ¥ç”¨**ã€‚

å¾ˆå¤šå›¢é˜Ÿç›´æŽ¥æŠŠä¸šåŠ¡æ•°æ®å˜åˆ°ElasticSearchï¼Œä¸å†ä½¿ç”¨MySQLã€‚è¿™åœ¨åˆæœŸç¡®å®žç®€å•é«˜æ•ˆï¼Œä½†éšç€ä¸šåŠ¡å‘å±•ï¼Œé—®é¢˜é€æ¸æš´éœ²ï¼š

**äº‹åŠ¡æ”¯æŒå¼±**ï¼šElasticSearchæ²¡æœ‰å®Œæ•´çš„äº‹åŠ¡æœºåˆ¶ï¼Œå¤æ‚ä¸šåŠ¡é€»è¾‘éš¾ä»¥å®žçŽ°
**æ›´æ–°æ€§èƒ½å·®**ï¼šé¢‘ç¹æ›´æ–°ä¼šå¯¼è‡´å¤§é‡segmentæ–‡ä»¶ï¼ŒæŸ¥è¯¢æ€§èƒ½ä¸‹é™
æ•°æ®ä¸€è‡´æ€§éš¾ä¿è¯ï¼šåˆ†å¸ƒå¼çŽ¯å¢ƒä¸‹çš„æ•°æ®ä¸€è‡´æ€§æ˜¯ä¸ªå¤§é—®é¢˜

æˆ‘çš„å»ºè®®æ˜¯ï¼šElasticSearchä½œä¸ºæœç´¢å¼•æ“Žï¼ŒMySQLä½œä¸ºæ•°æ®å˜å‚¨ï¼Œä¸¤è€ å„å¸å ¶èŒã€‚é€šè¿‡CDCæˆ–åŒå†™æ¨¡å¼ä¿æŒæ•°æ®åŒæ¥ï¼Œæ—¢äº«å—ElasticSearchçš„æœç´¢èƒ½åŠ›ï¼Œåˆä¿ç•™MySQLçš„äº‹åŠ¡ç‰¹æ€§ã€‚

å¦ä¸€ä¸ªå¸¸è§è¯¯åŒºæ˜¯ï¼š**å¿½è§†é›†ç¾¤è¿ç»´**ã€‚å¾ˆå¤šå›¢é˜Ÿæå»ºå®Œé›†ç¾¤å°±ä¸ç®¡äº†ï¼Œç›´åˆ°å‡ºé—®é¢˜æ‰ä¸´æ—¶æŠ±ä½›è„šã€‚å»ºè®®ä»Žé¡¹ç›®åˆæœŸå°±å»ºç«‹å®Œå–„çš„ç›‘æŽ§ä½“ç³»ï¼ˆä½¿ç”¨ElasticSearch Headã€Kibanaã€Prometheusç‰ï¼‰ï¼Œå®šæœŸè¿›è¡Œå®¹é‡è§„åˆ’å’Œæ•
éšœæ¼”ç»ƒã€‚

æœ€åŽï¼ŒElasticSearchçš„å¦ä¹ æ›²çº¿ç¡®å®žé™¡å³ï¼Œä½†ä¸€æ—¦æŽŒæ¡ï¼Œä½ ä¼šå‘çŽ°å®ƒæ˜¯ä¸€ä¸ªå¼ºå¤§è€Œä¼˜é›
çš„æœç´¢å¼•æ“Žã€‚å¸Œæœ›è¿™ç¯‡æ–‡ç« èƒ½å¸®åŠ©ä½ å°‘èµ°å¼¯è·¯ï¼Œåœ¨å®žè·µä¸çœŸæ£å‘æŒ¥ElasticSearchçš„å¨åŠ›ã€‚

ä½œè€ ï¼šæž¶æž„å®žæˆ˜ç³»åˆ— | å—æ•°ï¼šçº¦4500å—

《【架构实战】ElasticSearch搜索集群：全文检索的艺术》是转载文章，点击查看原文。

【架构实战】ElasticSearch搜索集群：全文检索的艺术

ã€æž¶æž„å®žæˆ˜ã€‘ElasticSearchæœç´¢é›†ç¾¤ï¼šå

ä¸€ã€ä»Žä¸€ä¸ªçœŸå®žçš„æ•

äºŒã€æ ¸å¿ƒæ¦‚å¿µï¼šå€’æŽ’ç´¢å¼•â€”â€”æœç´¢çš„åŸºçŸ³

2.1 ä»€ä¹ˆæ˜¯å€’æŽ’ç´¢å¼•ï¼Ÿ

2.2 å€’æŽ’ç´¢å¼•çš„ç»“æž„

2.3 å®žæˆ˜ï¼šæŸ¥çœ‹å€’æŽ’ç´¢å¼•

ä¸‰ã€åˆ†ç‰‡ä¸Žå‰¯æœ¬ï¼šåˆ†å¸ƒå¼çš„è‰ºæœ¯

3.1 åˆ†ç‰‡ï¼ˆShardï¼‰ï¼šæ•°æ®çš„æ°´å¹³åˆ‡åˆ†

3.2 å‰¯æœ¬ï¼ˆReplicaï¼‰ï¼šé«˜å¯ç”¨çš„ä¿éšœ

3.3 åˆ†ç‰‡åˆ†é

3.4 å®žæˆ˜æ¡ˆä¾‹ï¼šåˆ†ç‰‡åˆ†é

å››ã€æœç´¢ä¼˜åŒ–ï¼šä»Žå

4.1 æŸ¥è¯¢DSLï¼šæž„å»ºå¤æ‚æŸ¥è¯¢

4.2 ç›¸å

4.3 é«˜äº®æ˜¾ç¤ºï¼šè®©ç»“æžœæ›´ç›´è§‚

4.4 èšåˆåˆ†æžï¼šä¸åªæ˜¯æœç´¢

äº”ã€å®žæˆ˜æ¡ˆä¾‹ï¼šç”µå•†æœç´¢ç³»ç»Ÿæž¶æž„

5.1 ç³»ç»Ÿæž¶æž„è®¾è®¡

5.2 æ•°æ®åŒæ¥æ–¹æ¡ˆ

5.3 æœç´¢æ€§èƒ½ä¼˜åŒ–

å

è¸©å‘ä¸€ï¼šæ·±åº¦åˆ†é¡µæ€§èƒ½é—®é¢˜

è¸©å‘äºŒï¼šå—æ®µç±»åž‹é”™è¯¯å¯¼è‡´æ— æ³•èšåˆ

è¸©å‘ä¸‰ï¼šé›†ç¾¤è„‘è£‚é—®é¢˜

è¸©å‘å››ï¼šJVMå †å†

ä¸ƒã€æ€»ç»“

å

ä¹ã€ä¸ªäººè§‚ç‚¹

【架构实战】ElasticSearch搜索集群：全文检索的艺术

ã€æž¶æž„å®žæˆ˜ã€‘ElasticSearchæœç´¢é›†ç¾¤ï¼šå

ä¸€ã€ä»Žä¸€ä¸ªçœŸå®žçš„æ•

äºŒã€æ ¸å¿ƒæ¦‚å¿µï¼šå€’æŽ’ç´¢å¼•â€”â€”æœç´¢çš„åŸºçŸ³

2.1 ä»€ä¹ˆæ˜¯å€’æŽ’ç´¢å¼•ï¼Ÿ

2.2 å€’æŽ’ç´¢å¼•çš„ç»“æž„

2.3 å®žæˆ˜ï¼šæŸ¥çœ‹å€’æŽ’ç´¢å¼•

ä¸‰ã€åˆ†ç‰‡ä¸Žå‰¯æœ¬ï¼šåˆ†å¸ƒå¼çš„è‰ºæœ¯

3.1 åˆ†ç‰‡ï¼ˆShardï¼‰ï¼šæ•°æ®çš„æ°´å¹³åˆ‡åˆ†

3.2 å‰¯æœ¬ï¼ˆReplicaï¼‰ï¼šé«˜å¯ç”¨çš„ä¿éšœ

3.3 åˆ†ç‰‡åˆ†é

3.4 å®žæˆ˜æ¡ˆä¾‹ï¼šåˆ†ç‰‡åˆ†é

å››ã€æœç´¢ä¼˜åŒ–ï¼šä»Žå

4.1 æŸ¥è¯¢DSLï¼šæž„å»ºå¤æ‚æŸ¥è¯¢

4.2 ç›¸å

4.3 é«˜äº®æ˜¾ç¤ºï¼šè®©ç»“æžœæ›´ç›´è§‚

4.4 èšåˆåˆ†æžï¼šä¸åªæ˜¯æœç´¢

äº”ã€å®žæˆ˜æ¡ˆä¾‹ï¼šç”µå•†æœç´¢ç³»ç»Ÿæž¶æž„

5.1 ç³»ç»Ÿæž¶æž„è®¾è®¡

5.2 æ•°æ®åŒæ­¥æ–¹æ¡ˆ

5.3 æœç´¢æ€§èƒ½ä¼˜åŒ–

å

è¸©å‘ä¸€ï¼šæ·±åº¦åˆ†é¡µæ€§èƒ½é—®é¢˜

è¸©å‘äºŒï¼šå­—æ®µç±»åž‹é”™è¯¯å¯¼è‡´æ— æ³•èšåˆ

è¸©å‘ä¸‰ï¼šé›†ç¾¤è„‘è£‚é—®é¢˜

è¸©å‘å››ï¼šJVMå †å†

ä¸ƒã€æ€»ç»“

å

ä¹ã€ä¸ªäººè§‚ç‚¹

ã€æž¶æž„å®žæˆ˜ã€‘ElasticSearchæœç´¢é›†ç¾¤ï¼šå

ä¸€ã€ä»Žä¸€ä¸ªçœŸå®žçš„æ•

äºŒã€æ ¸å¿ƒæ¦‚å¿µï¼šå€’æŽ’ç´¢å¼•â€”â€”æœç´¢çš„åŸºçŸ³

ä¸‰ã€åˆ†ç‰‡ä¸Žå‰¯æœ¬ï¼šåˆ†å¸ƒå¼çš„è‰ºæœ¯

3.1 åˆ†ç‰‡ï¼ˆShardï¼‰ï¼šæ•°æ®çš„æ°´å¹³åˆ‡åˆ†

3.2 å‰¯æœ¬ï¼ˆReplicaï¼‰ï¼šé«˜å¯ç”¨çš„ä¿éšœ

å››ã€æœç´¢ä¼˜åŒ–ï¼šä»Žå

4.1 æŸ¥è¯¢DSLï¼šæž„å»ºå¤æ‚æŸ¥è¯¢

4.4 èšåˆåˆ†æžï¼šä¸åªæ˜¯æœç´¢

äº”ã€å®žæˆ˜æ¡ˆä¾‹ï¼šç”µå•†æœç´¢ç³»ç»Ÿæž¶æž„

5.2 æ•°æ®åŒæ¥æ–¹æ¡ˆ

5.3 æœç´¢æ€§èƒ½ä¼˜åŒ–

è¸©å‘ä¸€ï¼šæ·±åº¦åˆ†é¡µæ€§èƒ½é—®é¢˜

è¸©å‘äºŒï¼šå—æ®µç±»åž‹é”™è¯¯å¯¼è‡´æ— æ³•èšåˆ

è¸©å‘ä¸‰ï¼šé›†ç¾¤è„‘è£‚é—®é¢˜

è¸©å‘å››ï¼šJVMå †å†

ä¸ƒã€æ€»ç»“

ä¹ã€ä¸ªäººè§‚ç‚¹