Commit dbd71001 by 20210828028

modified

parent 9d302ad8
......@@ -111,7 +111,7 @@
### 预处理之后的数据文件夹结构
![image.png](https://upload-images.jianshu.io/upload_images/19393379-a67579c6c237ae29.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
![image.png](figs/data_structure.png)
## 数据预处理
......@@ -171,7 +171,7 @@ logits = model(input_ids, token_type_ids).reshape(
触发词抽取模型是整体模型的一部分,该部分主要是给定事件类型,识别句子中出现的事件触发词对应的位置以及对应的事件类别
###模型
该模型是基于ERNIE开发序列标注模型,模型原理图如下:
![image.png](https://upload-images.jianshu.io/upload_images/19393379-c770bed4ab3df9cc.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
![image.png](figs/ernie_triger_extraction.png)
上述样例中通过模型识别出:
......@@ -188,7 +188,7 @@ logits = model(input_ids, token_type_ids).reshape(
### 模型
论元识别模型训练与触发词模型训练相同,
该部分主要是识别出事件中的论元以及对应论元角色,模型原理图如下:
![image.png](https://upload-images.jianshu.io/upload_images/19393379-a15b9d1a47bda1ac.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
![image.png](figs/ernie_argument_extraction.png)
上述样例中通过模型识别出:
```txt
......@@ -207,7 +207,7 @@ logits = model(input_ids, token_type_ids).reshape(
### 模型
基于ERNIE序列分类模型
`paddlenlp.transformers.ErnieForSequenceClassification`来进行枚举分类。枚举角色类型为环节。模型原理图如下:
![image.png](https://upload-images.jianshu.io/upload_images/19393379-a505a220cb6ca092.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
![image.png](figs/ernie_enum_classification.png)
给定文本,对文本进行分类,得到不同类别上的概率 筹备上市(0.8)、暂停上市(0.02)、正式上市(0.15)、终止上市(0.03)
###损失函数
......@@ -216,7 +216,7 @@ logits = model(input_ids, token_type_ids).reshape(
与触发词识别模型相同,使用`paddle.optimizer.AdamW`作为优化器
# 效果
![image.png](https://upload-images.jianshu.io/upload_images/19393379-b02b8cf1e64d9b2c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
![image.png](figs/results.png)
# 优化相关思考
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment