大規模言語モデルを使って組織内の全データを検索する時にはどのような前処理を行うと効率的なのか?