@yama35_ これはまた難しい課題だ。
日本語は単語の区切りにスペースをつけないので分解してインデックスするんだけど、アルファベットの並びはそのまま単語として理解して分解しないから、
複数の単語で構成されている語であることを人間側が知っていないと気付かないね。
ちなみに、わかっているなら、
"al jazeera",aljazeera
って書くことで両方の検索結果を同時に出せるね。
これに対応するには、自動的に複数単語に分解して候補に加える機能と辞書が必要だけど、そういう分解機能が要るわ。
ElasticseachではDictionaryCompoundWordTokenFilterで出来そう。