2021年09月28日(火)
PDFやnxml等で書かれた科学論文を読みやすくHTMLに自動変換する実験的なWebアプリ・「Paper to HTML」
Paper to HTML
Paper to HTMLはPDFやJATS XML等で書かれた科学論文を読みやすくHTMLに自動変換するWebアプリです。今のところは実験的なプロトタイプで、科学論文をHTMLでレンダリングし、スマホ等でも読みやすくすることを目的として開発されたそうです。現在対応しているファイル形式は、PDF、LaTeX、PubMed Central XML等となっています。機械学習で論文からコンテンツを抽出しているそうで、今はエラーは避けられないそうですが改善策を模索しているそうで、このような一般公開もその一つかもしれません。
今後の展開としてオープンソース化も検討しているそうですが、テキストデータの抽出に使用しているライブラリのみソースコードが公開されています。
Paper to HTML
author:
かちびと.net
WordPressやJQueryなどを中心に、Web開発者のためのチュートリアルやコードスニペットの記事を公開しているTakahashi Yoheiさんのブログ
関連記事
Ads
WordPressやJQueryなどを中心に、Web開発者のためのチュートリアルやコードスニペットの記事を公開しているTakahashi Yoheiさんのブログかちびと.netの記事『PDFやnxml等で書かれた科学論文を読みやすくHTMLに自動変換する実験的なWebアプリ・「Paper to HTML」』についてまとめています。
この記事は特にアプリについて書かれており、 気になるWebデザインの記事やまとめを見つけたら「本文を読む」をクリックすると、記事配信元のかちびと.netで全文を閲覧することができます。RSS Sourceの「このサイトの記事一覧」をクリックするとかちびと.netの記事をまとめて表示することができます。また閲覧数や各SNSのシェア状況を目安に、他の人たちが記事をどのように評価しているのか推測することができます。Webデザインにとって有益な記事をまとめていますので、ぜひリンク先をチェックしてみてください。