PubMed文獻轉換工具使用說明

為什麼需要這個工具?

PubMed資料輸出的困境

當我們在PubMed資料庫搜尋文獻時,經常會遇到一個兩難的問題:

想要完整的摘要(Abstract)嗎?

想要方便管理的試算表格式?

這就像是:

我們能否兩者兼得? 這就是這個工具誕生的原因!


這個工具能做什麼?

這個Python程式可以將PubMed的NBIB格式文獻檔案,轉換成包含完整摘要的CSV試算表格式。

為什麼選擇NBIB格式?

NBIB (National Library of Medicine Bibliographic format) 是PubMed的標準書目格式,具有以下優勢:

  1. 結構化標籤: 每個欄位都有明確的標籤識別(如 TI - 代表標題)
  2. 內容完整: 包含所有文獻資訊,包括完整摘要
  3. 格式穩定: 標準化格式,解析準確度高

轉換前 vs 轉換後

轉換前(.nbib檔案):

PMID- 29793717
TI  - Quality assurance processes for standardized patient programs.
AB  - OUR PROBLEM: As the pharmacy profession evolves to include non-dispensing 
      services and collaborative care, greater emphasis is placed on communication 
      skills building through standardized patient programs...
AU  - Zhang S
AU  - Soreide KK
...
(標籤式格式,難以快速瀏覽比較)

轉換後(CSV檔案,可用Excel開啟):

Number Journal Year Title Authors Abstract PMID DOI
1 J Clin Med 2019 Personalized 3D... Sun Z, Lau I... Patient-specific... 30995803 10.3390/...
2 ... ... ... ... ... ... ...

現在你可以:


如何從PubMed下載NBIB格式檔案?

步驟說明

  1. 在PubMed搜尋文獻
    • 前往 PubMed
    • 輸入你的搜尋關鍵字
  2. 選擇要下載的文獻
    • 可以選擇特定文獻,或全選所有搜尋結果
    • 點選文獻旁的核取方塊
  3. 下載NBIB格式
    • 點選頁面上方的 "Send to" 按鈕
    • 選擇 "Citation manager"
  4. 檔案說明
    • 下載的檔案副檔名為 .nbib
    • 這是純文字檔案,可用任何文字編輯器開啟
    • 包含完整的文獻資訊,包括摘要

程式運作原理

簡單來說

這個程式就像一個「智慧型文字解析器」,它會:

  1. 讀取:打開PubMed的.nbib文獻檔案
  2. 分析:識別每篇文獻的開始與結束
  3. 提取:從每篇文獻中抓取重要資訊
  4. 整理:將資訊排列成表格格式
  5. 輸出:儲存為CSV檔案

提取的資訊包括

程式會自動提取以下13項資訊:
NBIB使用標準化的標籤來標記不同類型的資訊:

標籤 意義 範例
PMID- PubMed唯一識別碼 29793717
TI - 標題 (Title) Quality assurance processes...
AB - 摘要 (Abstract) OUR PROBLEM: As the pharmacy...
AU - 作者 (Author) Zhang S
AD - 作者單位 (Affiliation) University of Michigan...
TA - 期刊簡稱 (Journal) Curr Pharm Teach Learn
DP - 出版日期 2018 Apr
VI - 卷數 (Volume) 10
IP - 期數 (Issue) 4
PG - 頁碼 (Pages) 523-528
PT - 出版類型 Journal Article; Review
OT - 關鍵字 (Keywords) Assessment; Communication
LA - 語言 eng

使用方法

前置準備

  1. 安裝Python:從 python.org 下載安裝
  2. 準備PubMed文獻檔案:
    • 在PubMed搜尋文獻
    • 選擇要下載的文獻
    • 選擇格式:Send toFile → 格式選 PubMed
    • 儲存為TXT檔案

執行步驟

方法A:直接執行(最簡單)

  1. 程式碼儲存為 converter.py
  2. 將NBIB檔案放在同一個資料夾
  3. 修改程式碼中的檔案名稱(第160-161行):
input_file = "你的檔案名稱.nbib"
output_file = "輸出檔案名稱.csv"
  1. 開啟命令列視窗,執行:
python nbib_converter.py

方法B:在其他Python程式中呼叫

from convert import convert_nbib_to_csv

# 自訂檔案名稱
convert_nbib_to_csv("我的文獻.nbib", "結果.csv")

方法C:批次處理多個檔案

from nbib_converter import convert_nbib_to_csv

files = [
    ("心血管文獻.nbib", "心血管_結果.csv"),
    ("神經科學文獻.nbib", "神經科學_結果.csv"),
    ("腫瘤學文獻.nbib", "腫瘤學_結果.csv"),
]

for input_f, output_f in files:
    print(f"\n處理: {input_f}")
    convert_nbib_to_csv(input_f, output_f)