Semantic Scholarは科学文献のための研究ツールです。アレンAI研究所で開発され、2015年11月に一般公開されました。[ 2 ] Semantic Scholarは、自然言語処理の最新技術を用いて研究プロセスを支援します。例えば、学術論文の自動生成要約を提供します。[ 3 ] Semantic Scholarチームは、自然言語処理、機械学習、ヒューマンコンピュータインタラクション、情報検索における人工知能の活用について積極的に研究を行っています。[ 4 ]
Semantic Scholarは、コンピュータサイエンス、地球科学、神経科学のトピックに関するデータベースとして始まりました。[ 5 ] 2017年には、このシステムのコーパスに生物医学文献が含まれるようになりました。[ 5 ] 2022年9月現在、すべての科学分野から2億件以上の出版物が含まれています。[ 6 ]
テクノロジー
Semantic Scholarは、科学文献を一文で要約するサービスです。その目的の一つは、モバイル端末で多数の論文タイトルや長文の抄録を読むという課題に対処することでした。[ 7 ]また、年間300万本の科学論文が読者に確実に届くようにすることも目指しています。なぜなら、これらの論文のうち実際に読まれるのは半分程度と推定されているからです。[ 8 ]
人工知能は論文のエッセンスを捉えるために使用され、「抽象化」技術を通じてそれを生成します。[ 3 ]このプロジェクトでは、機械学習、自然言語処理、機械視覚を組み合わせて、従来の引用分析方法に意味分析のレイヤーを追加し、論文から関連する図、表、エンティティ、会場を抽出します。[ 9 ] [ 10 ]
AIを活用したもう一つの重要な機能は、Research Feedsです。これは、AIを活用してユーザーが読みたい論文を素早く学習し、最新の研究を推奨することで、研究者が最新の情報を入手できるよう支援する適応型研究レコメンデーション機能です。対照学習を用いてトレーニングされた論文埋め込みモデルを用いて、各ライブラリフォルダ内の論文と類似する論文を検索します。[ 11 ]
Semantic ScholarはSemantic Readerも提供しています。これは科学論文の読みやすさと文脈の豊富さを向上させることで科学論文の読み方に革命を起こす可能性を秘めた拡張リーダーです。[ 12 ] Semantic Readerはインライン引用カードを提供し、ユーザーはこれを使ってTLDR(Too Long, Didn't Readの略)という短い要約を自動的に生成して引用文を見ることができます。また、論文の要点をとらえたスキミングハイライトが表示されるので、ユーザーはより早く論文を理解できます。
Google ScholarやPubMedとは対照的に、Semantic Scholarは論文の最も重要で影響力のある要素を強調するように設計されています。[ 13 ] AIテクノロジーは、研究トピック間の隠れたつながりやリンクを識別するように設計されています。[ 14 ]前述の検索エンジンと同様に、Semantic Scholarもグラフ構造を活用しており、これにはMicrosoft Academic Knowledge Graph、Springer NatureのSciGraph、Semantic Scholar Corpus(もともとコンピューターサイエンス、神経科学、生物医学の分野で4500万本の論文コーパスでした)が含まれます。[ 15 ] [ 16 ]
記事識別子
Semantic Scholarがホストする各論文には、Semantic Scholar Corpus ID(略称S2CID)と呼ばれる一意の識別子が割り当てられます。以下はその一例です。
Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (2020年3月). 「COVID-19の再生産数はSARSコロナウイルスと比較して高い」. Journal of Travel Medicine . 27 (2). doi : 10.1093 / jtm/taaa021 . PMID 32052846. S2CID 211099356 .
インデックス作成
Semantic Scholarは無料で利用でき、類似の検索エンジン(Google Scholarなど)とは異なり、有料コンテンツを検索しません。[ 5 ]
ある研究では、Semantic ScholarとGoogle Scholarの索引範囲を比較し、コンピュータサイエンスの二次研究で引用されている論文については、2つの索引は同等の範囲をカバーしており、それぞれ少数の論文が欠落しているだけであることがわかった。[ 17 ]
ユーザー数と出版物数
2017年に生物医学論文とトピックの要約を追加したプロジェクトを経て、2018年1月現在、Semantic Scholarコーパスにはコンピューターサイエンスと生物医学からの4000万件以上の論文が収録されている。[ 18 ] 2018年3月、 Amazon Alexaプラットフォーム向け機械学習イニシアチブを開発したDoug RaymondがSemantic Scholarプロジェクトのリーダーに採用された。[ 19 ] 2019年8月現在、 Microsoft Academic Graphレコードの追加により、収録されている論文のメタデータ(実際のPDFではない)の数は1億7300万件を超えている[ 20 ]。[ 21 ] 2020年には、Semantic Scholarとシカゴ大学出版局ジャーナルの提携により、シカゴ大学出版局で出版されたすべての論文がSemantic Scholarコーパスで利用できるようになった。[ 22 ] 2020年末までに、Semantic Scholarは1億9000万件の論文を索引付けました。[ 23 ] 2020年には、Semantic Scholarの月間ユーザー数は700万人に達しました。[ 7 ]
参照
参考文献
- ^ジョーンズ、ニコラ (2015). 「人工知能研究所が無料科学検索エンジンを立ち上げ」 . Nature . doi : 10.1038/nature.2015.18703 . ISSN 1476-4687 . S2CID 182440976 .
- ^ Eunjung Cha, Ariana (2015年11月3日). 「ポール・アレンのAI研究グループが、科学的知識の検索方法を一新することを目指したプログラムを発表。ぜひお試しください」。ワシントン・ポスト。2019年11月6日時点のオリジナルよりアーカイブ。 2015年11月3日閲覧。
- ^ a b Hao, Karen (2020年11月18日). 「AIがAIの最新情報をまとめるお手伝いをします」 . MIT Technology Review . 2021年2月16日閲覧。
- ^ 「Semantic Scholar Research」 . research.semanticscholar.org . 2021年11月22日閲覧。
- ^ a b c Fricke, Suzanne (2018-01-12). 「Semantic Scholar」. Journal of the Medical Library Association . 106 (1): 145– 147. doi : 10.5195/jmla.2018.280 . ISSN 1558-9439 . PMC 5764585. S2CID 45802944 .
- ^ Matthews, David (2021年9月1日). 「文献で溺れる?スマートソフトウェアツールが助けになる」 . Nature . 2022年9月5日閲覧.
...ワシントン州シアトルのアレン人工知能研究所が2015年に立ち上げたツール、Semantic Scholarによって収集された公開コーパスは、プレプリントを含め約2億件の論文に相当します。
- ^ a b Grad, Peter (2020年11月24日). 「AIツールが長文の論文を一文で要約」 . Tech Xplore . 2021年2月16日閲覧。
- ^ 「アレン研究所のセマンティック・スカラー、1億7500万件の学術論文を検索可能に」 VentureBeat . 2019年10月23日. 2021年1月28日時点のオリジナルよりアーカイブ。 2021年2月16日閲覧。
- ^ Bohannon, John (2016年11月11日). 「コンピュータープログラムが現代で最も影響力のある脳科学者をランク付け」 . Science . doi : 10.1126/science.aal0371 . 2020年4月29日時点のオリジナルよりアーカイブ。 2016年11月12日閲覧。
- ^ Christopher Clark、Santosh Divvala (2016). PDFFigures 2.0: 研究論文からの図表マイニング. Proceedings of the 16th ACM/IEEE-CS on Joint Conference on Digital Libraries - JCDL '16. Wikidata Q108172042 .
- ^ “Semantic Scholar | よくある質問” . 2023年7月15日時点のオリジナルよりアーカイブ。
- ^ “Semantic Scholar | Semantic Reader” . Semantic Scholar . 2023年7月15日時点のオリジナルよりアーカイブ。
- ^ 「Semantic Scholar」 . International Journal of Language and Literary Studies . 2021年11月9日閲覧。
- ^ Baykoucheva, Svetla (2021).デジタル時代における科学情報発見の推進. Chandos Publishing. p. 91. ISBN 978-0-12-823724-3. OCLC 1241441806 .
- ^ホセ、ジョーモン M.ユルマズ、エミネ。マガリャンイス、ジョアン。カステルズ、パブロ。フェロ、ニコラ。シルバ、マリオ J.マルティンス、フラヴィオ (2020)。情報検索の進歩: 第 42 回 IR 研究欧州会議、ECIR 2020、ポルトガル、リスボン、2020 年 4 月 14 ~ 17 日、議事録、パート I。スイス、シャム:シュプリンガー・ネイチャー。 p. 254.ISBN 978-3-030-45438-8. OCLC 1164658107 .
- ^ Ammar, Waleed (2019). 「Open Research Corpus」 . Semantic Scholar Lab Open Research Corpus . 2019年3月29日時点のオリジナルよりアーカイブ。 2024年8月5日閲覧。
- ^ Hannousse, Abdelhakim (2021). 「ソフトウェア工学の二次研究のための関連論文の検索:Semantic Scholarのカバレッジと識別の役割」 . IET Software . 15 (1): 126– 146. doi : 10.1049/sfw2.12011 . ISSN 1751-8814 . S2CID 234053002 .
- ^ 「AI2、Semantic Scholar検索エンジンを生物医学研究まで拡張」 GeekWire . 2017年10月17日. 2018年1月19日時点のオリジナルよりアーカイブ。 2018年1月18日閲覧。
- ^ 「テック動向:アレン研究所がAmazon Alexaの機械学習リーダーを採用、Microsoft会長が新たな投資家役に就任、その他」 GeekWire. 2018年5月2日. 2018年5月10日時点のオリジナルよりアーカイブ。 2018年5月9日閲覧。
- ^ “Semantic Scholar” . Semantic Scholar . 2019年8月11日時点のオリジナルよりアーカイブ。 2019年8月11日閲覧。
- ^ 「AI2、Microsoft Researchと提携し、科学研究のための検索ツールをアップグレード」 GeekWire . 2018年12月5日. 2019年8月25日時点のオリジナルよりアーカイブ。 2019年8月25日閲覧。
- ^ 「シカゴ大学出版局は、検索と発見可能性の向上を目指し、セマンティック・スカラーと提携する500社以上の出版社に加わる」 RCNi Company Limited . 2021年11月22日閲覧。
- ^ Dunn, Adriana (2020年12月14日). 「Semantic Scholar、新たな出版社との提携を通じて2020年に2500万本の科学論文を追加」(PDF) . Semantic Scholar . 2021年11月15日時点のオリジナル(PDF)からアーカイブ。 2021年11月22日閲覧。
外部リンク