= "SU=主题,TKA=篇关摘,KY=关键词,TI=篇名,FT=全文,AU=作者,FI=第一作者,RP=通讯作者,AF=作者单位,FU=基金,AB=摘要,CO=小标题, RF=参考文献,CLC=分类号,LY=文献来源, DOI=DOI,CF=被引频次"
s
= r"([A-Z]+)=(.*?),"
pattern
import re
import pandas as pd
= pd.DataFrame(re.findall(pattern, s), columns=['字段代码', '字段含义'])
df
= df.copy()
df1
df1
字段代码 | 字段含义 | |
---|---|---|
0 | SU | 主题 |
1 | TKA | 篇关摘 |
2 | KY | 关键词 |
3 | TI | 篇名 |
4 | FT | 全文 |
5 | AU | 作者 |
6 | FI | 第一作者 |
7 | RP | 通讯作者 |
8 | AF | 作者单位 |
9 | FU | 基金 |
10 | AB | 摘要 |
11 | CO | 小标题 |
12 | RF | 参考文献 |
13 | CLC | 分类号 |
14 | LY | 文献来源 |
15 | DOI | DOI |