📑 CPX Elastic PDF Search 2026 外部公開用説明書

数万件規模の社内 PDF を全文検索するシステムです。2026年より当社内で好評稼働中!

CPX Elastic PDF Search トップ画面
▲ 検索トップ画面(クリックで拡大)

📌 1. このシステムでできること

社内ファイルサーバに保管されている 30,000 件以上の PDF を、キーワードを入れるだけで一瞬で探せます。

具体的にどんなことができる?

💡 Google 検索と何が違うの? Google が世の中全体を探すのに対し、これは 社内 PDF だけ を探します。さらに、PDF の中身の文字を OCR (画像から文字を読み取る技術) で全部読んでいるので、スキャンされた契約書の本文まで検索対象です。

⚡ 2. 5 秒でできる基本検索

まずは試してみましょう。最初の検索ボックスに何か入れて Enter。これだけです。

語句検索
賃貸借契約 大阪 検索
↑ こんな感じで言葉を入れて「検索」ボタン or Enter キー

入力のコツ

✅ 試してみよう
  1. 画面の上の方の大きな検索ボックス契約 と入れて Enter
  2. 少し待つと、PDF の一覧がずらっと出ます
  3. サムネイル画像をクリックすると、その PDF が新しいタブで開きます

🎯 3. こんな時はこうする — シーン別ガイド

🏢 取引先の名前で探したい

「○○商事との契約書、どこにあったっけ?」
  1. 「語句検索」のボックスに 取引先の名前 を入れて Enter
  2. 例: ○○商事○○商事 契約
  3. 取引先の名前は「タグ」として PDF に自動で付いているので、ヒット率は高めです

📅 特定の月や日に作られた PDF だけ見たい

「先月作った書類を全部一覧したい」
  1. 「語句検索」セクションの 作成日 の欄を見つける
  2. 左のカレンダーで「開始日」、右のカレンダーで「終了日」を選ぶ
  3. すると、その期間に作られた PDF だけが新しい順に表示されます

キーワードと一緒に使うと: 例えば「契約 + 2024-04-01〜2024-04-30」で、4 月に作られた契約系の PDF だけに絞れます。

フィルタ
作成日: 2024-04-012024-04-30 クリア
↑ 開始日と終了日を入れます

📄 ファイル名の一部で探したい

「『議事録_2024』みたいなファイル、どこにあるかな」
  1. 画面を少し下にスクロールして「ファイル名検索」セクションを見つける
  2. ファイル名の一部を入れて Enter (大文字小文字気にしなくて OK)
  3. 例: 議事録 / 報告書_2024 / contract
💡 ヒント ファイル名検索だけだと「タイトル文字列のヒット」しか見ません。本文の中身を見たい時は「語句検索」の方を使ってください。

📚 厚い PDF (ページ数が多い) だけを見たい

「契約書本体っぽい、ボリュームのある書類だけ」
  1. PDF ページ数」フィルタに数値を入れる
  2. 例: 10 ページ以上 → 10 ページ未満の薄い書類は表示されない

逆に「1 ページの覚書みたいなのだけ」を見たい場合は、結果のヒストグラム (グラフ) から「1 ページ」セルをクリックする方法もあります (詳しくは後述)。

🫆 自分の手元の PDF が DB に登録されているか確認したい

「これと同じファイル、もうサーバにあるかな?」
  1. 画面を一番下までスクロール、「PDF ハッシュ照合」セクションを見つける
  2. 手元の PDF を ドラッグ&ドロップ (枠の中に放り込む) or 枠をクリックして PDF を選択
  3. 「✔ 登録済」と出れば社内 DB に同じファイルあり。「✘ 未登録」なら無し
🔒 安心ポイント PDF の中身はサーバに送られません。ハッシュ値 (64 文字の暗号化された ID) だけが照会に使われます。

✨ 似た内容の PDF をまとめて見たい

「この契約書みたいなパターンの書類、他にあるかな」
  1. 同じく「PDF ハッシュ照合」セクションで PDF をドロップ
  2. 登録済みの場合、自動的に 「ほぼ同一文書を探す」 が走り、似た PDF が表示されます
  3. もっと幅広く似たものを見たい時は、ラジオボタンで 「類似文書を探す」 に切り替え
  4. 「ほぼ同一」のしきい値は score ≥ 0.96 の数値で調整可。小さくすると「ちょっとだけ似てる」も含まれます
選択意味こんな時に
ほぼ同一文書を探す内容が 96% 以上一致するもの同じテンプレ書類の別バージョンを探す
類似文書を探す内容が似ているものを類似度順に「こういうパターンの文書」を網羅

👁️ 一覧をすばやくスクロールして眺めたい

「30件くらいヒットしたけど、ざっと斜め読みしたい」
  1. 各セクションの 表示方式 ラジオで「一覧 (1 行/PDF、クリックで PDF)」を選ぶ
  2. 1 件 1 行の超コンパクト表示になります
  3. 行をクリックすると、そのまま PDF が新しいタブで開きます

「標準」表示は 1 件あたりサムネ + 要約 + タグまで見える分、画面を埋めます。「一覧」は名前と日付だけで見渡しがいいです。

👀 4. 検索結果の画面の見かた

検索結果は、こんな感じで 1 件ずつ並びます (「標準」表示の場合):

5p サムネ
○○商事との不動産売買契約書 (2024 年 4 月締結)
不動産売買契約書_最終版.pdf
📁 …/取引先別/○○商事/2024年/契約
○○商事 不動産売買 契約書 2024年4月
作成日: 2024年4月15日
↑ 標準表示の 1 件 (実際の中身は別)

各パーツの意味

パーツ意味使いかた
サムネイル画像 PDF の 1 ページ目を縮小したもの クリックで PDF が新しいタブで開きます
5p バッジ (右上) PDF の総ページ数 「5p」= 5 ページ、「12p」= 12 ページ、ボリューム感の目安
要約 (薄いグレー枠) AI が PDF の中身を 1 行で要約したもの 中を開かなくても何の書類かわかる
ファイル名 そのまま PDF のファイル名
📁 フォルダパス サーバ上のどこにあるか 取引先別フォルダなど、整理場所がわかる
タグ (薄青の丸い印) AI が抽出した重要キーワード 関連 PDF を探す時の手がかりに
作成日 (黄色文字) PDF 内に記録されている作成日 古い順 / 新しい順の判断に

「OCR テキスト」ボタンって?

各結果の中に「OCR テキスト」というボタンがあります。クリックすると、PDF の中身を文字に変換した結果が展開されます。「キーワードが本文のどこに出てきたか」を確認するのに便利です。

💡 こんな使い方 検索で 消費税 が引っかかった PDF の OCR テキストを開くと、本文のどこに「消費税」と書いてあるかチェックできます。タイトルだけだとピンと来ない時に有用。

結果数の表示

検索結果の上に「2,345 PDF (15ms · ハイブリッド)」のような表示が出ます:

もっとたくさん表示したい

結果は最初に 50 件表示されます。画面を下にスクロールすると、自動的に次の 50 件が読み込まれます。「次へ」ボタンを押す必要はありません

🎚️ 5. 検索方式の選びかた (上級者向け)

普段は 「ハイブリッド」 のままで OK ですが、ヒットしすぎたり、逆に出てこない時は他の方式を試してみる価値があります。

検索方式
ハイブリッド (推奨) 単語検索 (BM25) 完全一致(希少順) 完全一致(日付順) 意味検索
方式こういう探し方こんな時に
ハイブリッド
(推奨・初期値)
単語のヒットも、意味の似たものも、まとめて関連度順 とりあえずこれ。 普段はこれで十分
単語検索 (BM25) 入力したキーワードがそのまま出てくる PDF を優先 固有名詞や正確な単語で探したい時
完全一致(希少順) キーワードが必ず含まれる結果のみ。珍しい組み合わせ優先 「絶対この単語が入ってる PDF だけ見たい」時
完全一致(日付順) キーワード必須かつ新しい順 「最新の○○契約書を見たい」時
意味検索 キーワードと「意味が似ている」PDF を探す 言葉が思い出せない、ふんわり探したい時
💡 困った時の使い分け早見表

score (スコア) って何?

「score: 0.0075 以下は表示しない」という設定があります。これは「キーワードとの一致度の最低ライン」です。

📊 6. グラフで絞り込む

作成日を入れて検索すると、結果の上に カレンダー風のグラフ が出てきます。これは「いつ・どの時間帯に・何ページの PDF が・何件作られたか」が一目でわかる地図です。

日付 0-22-44-66-88-1010-1212-1414-1616-1818-2020-2222-24 p1p2p3p4p5+
4/15(月) 1 51237 42 34 251584
4/13(土) この日はファイル無し 0
4/14(日) この日はファイル無し 0
4/29(月) 昭和の日 祝日 0
↑ 日付 × 時間帯 × ページ数のヒートマップ (色が濃いほど件数多い)

このグラフでできること

  1. 日付 (左端のラベル) をクリック → その日 1 日分の PDF だけに絞り込む
  2. マス目 (時間帯セル) をクリック → 「○月○日の 10-12 時に作られた PDF」に絞り込む
  3. 時間帯の見出し (一番上の「10-12」など) をクリック → 全日付の中で「10-12 時に作られた PDF」に絞り込む
  4. ページ数 (右側 p1, p2,...) をクリック → 「その日の 1 ページ PDF だけ」のような絞り込み

色の意味

日付の色分け

✅ 使いどころ○月の作成傾向を見たい」「営業時間外に作られた書類だけ見たい」「1 ページしかない覚書だけ見たい」のように、「絞り込み → さらに絞り込み」を視覚的に進められます。

グラフでクリックして絞り込んでいくと、画面の一番上にこんな小さなバーが現れます:

↑ 画面の一番上に固定で表示される「パンくずバー」

これは何?

「今、どんな絞り込みをしているか」の経路が見えます。Web ページの「ホーム > 商品一覧 > Aカテゴリ > 商品X」みたいなアレです。

戻りかた

💡 なんで「戻る」ボタンじゃないの? ブラウザの「戻る」(←) は普通のページ移動には使えますが、検索結果ページ内の絞り込みはこのパンくずで戻ります。慣れると 1 段ずつ戻ったり、一気にトップに戻ったり、自由自在。

📂 8. PDF を開く・フォルダを開く

PDF を開く

  1. 検索結果の サムネイル画像 をクリック
  2. 新しいタブで PDF が開きます
  3. ブラウザの PDF ビューワで普通に読めます (ページ移動、印刷、ダウンロードも OK)

「一覧」表示でも開ける

表示方式を「一覧 (1 行/PDF、クリックで PDF)」にしている場合、その行をどこをクリックしても PDF が開きます。

PDF が保存されているフォルダを開きたい

結果のフォルダパス (📁 で始まる行) をクリックすると、Windows のエクスプローラでそのフォルダが開きます。

⚠️ 初回のみ設定が必要なケース ブラウザのセキュリティの都合で、初回はクリックしてもフォルダが開かないことがあります。その時は IT 担当者に「Edge のローカルイントラネット設定」を依頼してください (一度設定すれば次回からは何もしなくて OK)。

🌐 9. ブラウザ操作のコツ (Chrome / Edge)

ブラウザの設定と操作を少し変えるだけで、検索結果のページが格段に快適になります。両方とも 1 回設定すれば以降ずっと有効。

⏬ ヒント1: PageDown / PageUp で 1 画面ぶんジャンプ

✅ 効果 1 ストロークで 1 画面ぶん、視点を見失わずに次のかたまりへ移動できます。

🚫 ヒント2: スムーズスクロールは OFF にする

Chrome / Edge のデフォルトは「ぬるっと滑らかにスクロールする」設定。検索結果が大量に並ぶこのシステムでは、スムーズスクロールは「目的の場所を一気に表示しない」「視点が引っ張られる」など、むしろ作業効率を下げます。OFF を強くお勧めします。

Chrome での設定手順

  1. 1アドレスバーに chrome://flags/#smooth-scrolling と入力 → Enter
  2. 2「Smooth Scrolling」項目を 「Disabled」 に変更
  3. 3画面下の 「Relaunch」 ボタンで Chrome を再起動

Edge での設定手順

  1. 1アドレスバーに edge://flags/#smooth-scrolling と入力 → Enter
  2. 2同じく 「Disabled」 に変更
  3. 3「Relaunch」 ボタンで Edge を再起動
✅ 効果 PageDown を押した瞬間にスパッと次画面に飛びます。ヌルッとした追従が消えて、目で追う負担が激減します。

🪄 10. うまく検索できない時のコツ

😵 結果が 0 件になっちゃった

🌊 結果が多すぎる

🎯 似てるけど別物が出てくる

🔡 表記揺れがある時

「XXX商事」と「XXX Corp」と「XXX・商事」、どれで打てばいい?

🔡 OCR の限界

📚 11. 用語集

本マニュアルや画面で出てくる、ちょっと聞き慣れない言葉を、たとえ話でやさしく説明します。

🫆 ハッシュ (Hash) — PDF の「指紋」

👁️ OCR (光学文字認識) — 画像から文字を読み取る技術

🧩 形態素 (けいたいそ) — 言葉の最小単位

💡 だから検索のコツ 「東京都」を「東京」で検索しても出ないことがあります。詳しくは Q&A の「『東京都』では出るのに『東京』だけでは出てこない」を参照してください。

❓ 12. よくある質問 Q&A

Q1. このシステム、毎日新しい PDF も自動で取り込まれるの?
毎晩 4:00 (深夜) に1回だけ更新されます。今日の昼にサーバに保存した PDF は、明日の朝以降 に検索できるようになります。即時反映はできません

あわせて、ファイルサーバから消された PDF も翌朝 4 時の巡回で検索結果から外されます。
Q2. 「タグ」って自分で付けるの?
いいえ。AI が自動で付けています。取引先名、物件名、書類の種類、金融機関名などを自動抽出してタグ化しています。完璧ではないので、目的の PDF にタグが付いていないこともあります。その場合は本文の単語で検索してください。
Q3. 自分の手元の PDF を追加したい
PDF をファイルサーバの所定フォルダに保存してください。翌朝 4 時の自動巡回で検索対象に追加されます。直接 Web 画面からアップロードする機能はありません (誤った場所への保存を防ぐため)。
Q4. 検索した内容は他の人に見られるの?
システム内には検索ログが残りますが、他のユーザーが閲覧できる場所には出ません。ただし、何を検索したかは IT 管理者がトラブル調査時に参照することはあります。
Q5. スキャンしただけの PDF (画像 PDF) も検索できる?
はい、できます。システムが OCR (画像から文字を読み取る技術) で全 PDF の中身をテキスト化しているので、スキャンされた契約書や手書き文書 (印刷文字なら) も検索対象です。手書き文字は精度が落ちることがあります。
Q6. 日付フィルタの「作成日」って、PDF を保存した日? それとも書類が作られた日?
PDF のファイルプロパティに記録されている作成日です。多くの場合は「PDF が作られた日 = 書類が作られた日」ですが、後からスキャンしたものは「スキャン日」になります。Word から PDF 化したものはその「PDF 化した日」が記録されます。
Q7. 1 つの PDF が同じ内容で複数の場所にあるとき、どうなる?
検索結果には 1 件として表示 されます (重複排除)。フォルダパスは代表的な 1 箇所が出ます。「他のコピーはどこ?」を知りたい場合は、PDF ハッシュ照合の「ほぼ同一文書を探す」が便利です。
Q8. スマホからも使える?
スマホからは使えません。 社内ネットワーク (192.168.X.X) に接続している端末からのみ利用可能で、スマホは通常社内 Wi-Fi に繋がっていないためです。社外 (自宅・カフェ・出張先) からも利用できません。 モバイル版のリリース予定もありません。
Q9. 検索しても古い PDF しか出てこない
検索方式が「ハイブリッド」だと「関連度の高い順」になるので、必ずしも新しい順ではありません。「完全一致(日付順)」に切り替えると、新しい順に並びます。
Q10. ロゴをクリックすると何が起きる?
画面左上の青いロゴをクリックすると、すべての絞り込み・検索条件をリセットしてまっさらな状態に戻ります。「やり直したい」時に便利。
Q11. 検索結果に出てこない PDF がある気がする
主な原因は 3 つ:
  1. まだ取り込まれていない — 昨日以降に追加された PDF は翌朝 4 時まで反映されません
  2. OCR で文字が拾えなかった — スキャン品質が極端に低い PDF だと、テキスト検索でヒットしないことがあります (ファイル名検索は使えます)
  3. アクセス権が無いフォルダ — 一部の機密フォルダは検索対象外です
ファイル名でも検索できない場合は IT 担当者に確認してください。
Q12. システムがエラー画面になった
まずブラウザを F5 でリロードしてみてください。それでも直らない場合は、左上のロゴをクリックして初期状態に戻し、もう一度試してみてください。それでもダメなら IT 担当者まで。
Q13. 中身にあるはずの言葉で検索しても出てこない
OCR (画像から文字を読み取る技術) がその箇所を上手く読めなかった可能性があります。

特に弱いケース:
  • 印刷が薄い・かすれている書類
  • 手書きの文字
  • 複雑なレイアウトや縦書き
  • FAX のような低解像度スキャン
対処法: 別のキーワード (前後の単語、固有名詞) で試す。ファイル名検索を併用する。
Q14. 「東京都」では出るのに「東京」だけでは出てこない
これは 形態素解析 という日本語処理の特性によるものです。

検索エンジンは「東京都」を 1 つの単語と認識していることがあります。その中の「東京」だけを切り出して検索すると別物として扱われ、ヒットしません。

対処法:
  • 「東京 港区」「東京 不動産」のように複数キーワードを組み合わせる
  • 検索方式を「意味検索」に切り替える (意味の似た文書を探す)
  • キーワードを増やして範囲を狭めるより、減らして「ハイブリッド」で試す
↑ トップに戻る
本マニュアルは PDF 検索システムのカジュアルユーザー向けガイドです。
困った時は IT 担当者まで。