全文検索システムRastの設計と実装
全文検索システムRastの設計と実装 全文検索システムRastの設計と実装
全文検索システムRastの設計と実装 各種文書フィルタ ● dlopenされたタイミングでフレームワークに必 要な情報を渡す ● フィルタの名前 ● 処理可能なMIMEタイプ ● 処理する関数ポインタ ● 各フィルタはストリームやメモリをラップするオ ブジェクト(apr_brigade)を受け取る ● テキストの抽出やプロパティの抽出を行う ● 必要であればエンコーディング変換を行う ● フレームワークがエンコーディング変換のためのヘルパ関 数を提供する
全文検索システムRastの設計と実装 各種文書フィルタ ● メタフィルタ ● 指定したMIMEタイプのフィルタを呼び出しオブジェクト (apr_brigade)を渡す ● MIMEタイプが指定されていなければlibmagicを用いて推 測する ● それでも不明な場合はエラーとする ● 登録フィルタ ● 受け取ったテキストやプロパティを逐次データベースに登 録する ● メイル,HTML,PDF,PostScript, OpenOffice.org,tar,zip...
- Page 1 and 2: 全文検索システムRastの設
- Page 3 and 4: 全文検索システムRastの設
- Page 5 and 6: 全文検索システムRastの設
- Page 7 and 8: 全文検索システムRastの設
- Page 9 and 10: 全文検索システムRastの設
- Page 11 and 12: 全文検索システムRastの設
- Page 13 and 14: 全文検索システムRastの設
- Page 15 and 16: 全文検索システムRastの設
- Page 17 and 18: 全文検索システムRastの設
- Page 19 and 20: 全文検索システムRastの設
- Page 21 and 22: 全文検索システムRastの設
- Page 23 and 24: 全文検索システムRastの設
- Page 25 and 26: 全文検索システムRastの設
- Page 27 and 28: 全文検索システムRastの設
- Page 29 and 30: 全文検索システムRastの設
- Page 31 and 32: 全文検索システムRastの設
- Page 33 and 34: 全文検索システムRastの設
- Page 35 and 36: 全文検索システムRastの設
- Page 37: 全文検索システムRastの設
<strong>全文検索システムRastの設計と実装</strong><br />
各種文書フィルタ<br />
● メタフィルタ<br />
● 指定したMIMEタイプのフィルタを呼び出しオブジェクト<br />
(apr_brigade)を渡す<br />
● MIMEタイプが指定されていなければlibmagicを用いて推<br />
測する<br />
● それでも不明な場合はエラーとする<br />
● 登録フィルタ<br />
● 受け取ったテキストやプロパティを逐次データベースに登<br />
録する<br />
● メイル,HTML,PDF,PostScript,<br />
OpenOffice.org,tar,zip...