s = "SU=主题,TKA=篇关摘,KY=关键词,TI=篇名,FT=全文,AU=作者,FI=第一作者,RP=通讯作者,AF=作者单位,FU=基金,AB=摘要,CO=小标题, RF=参考文献,CLC=分类号,LY=文献来源, DOI=DOI,CF=被引频次"
pattern = r"([A-Z]+)=(.*?),"
import re
import pandas as pd
df = pd.DataFrame(re.findall(pattern, s), columns=['字段代码', '字段含义'])
df1 = df.copy()
df1| 字段代码 | 字段含义 | |
|---|---|---|
| 0 | SU | 主题 |
| 1 | TKA | 篇关摘 |
| 2 | KY | 关键词 |
| 3 | TI | 篇名 |
| 4 | FT | 全文 |
| 5 | AU | 作者 |
| 6 | FI | 第一作者 |
| 7 | RP | 通讯作者 |
| 8 | AF | 作者单位 |
| 9 | FU | 基金 |
| 10 | AB | 摘要 |
| 11 | CO | 小标题 |
| 12 | RF | 参考文献 |
| 13 | CLC | 分类号 |
| 14 | LY | 文献来源 |
| 15 | DOI | DOI |