0 BERT模型简介

BERT(Bidirectional Encoder Representations from Transformers)是一种基于多层Transformer编码器的预训练语言模型,由Google在2018年提出。BERT的核心技术是Transformer,它是一种基于自注意力机制的神经网络架构,用于处理序列化数据,特别擅长捕捉长距离依赖关系。

BERT模型的主要创新点都在预训练(pre-train)方法上,BERT通过两种预训练任务来学习语言表示:Masked Language Model (MLM) Next Sentence Prediction (NSP)

  1. Masked Language Model (MLM):

    在MLM任务中,BERT随机遮蔽输入句子中的一些单词(例如,用特殊标记[MASK]替换),然后预测这些遮蔽单词
  2. Next Sentence Prediction (NSP):

    NSP任务用于预测两个句子是否是连续的,这有助于模型学习句子级别的关系
  • 在用Masked Language Model方法训练BERT的时候,随机把语料库中15%的单词做Mask操作。这15%的单词做Mask操作分为三种情况:80%的单词直接用[Mask]替换、10%的单词直接替换成另一个新的单词、10%的单词保持不变。
  • 因为涉及到Question Answering (QA) 和 Natural Language Inference (NLI)之类的任务,增加了Next Sentence Prediction预训练任务,目的是让模型理解两个句子之间的联系。与Masked Language Model任务相比,Next Sentence Prediction更简单些,训练的输入是句子A和B,B有一半的几率是A的下一句,输入这两个句子,BERT模型预测B是不是A的下一句。

BERT预训练之后,会保存它的Embedding table和12层Transformer权重(BERT-BASE)或24层Transformer权重(BERT-LARGE)。使用预训练好的BERT模型可以对下游任务进行微调(Fine-tuning),比如:文本分类、相似度判断、阅读理解等。

对话情绪识别(Emotion Detection,简称EmoTect),专注于识别智能对话场景中用户的情绪,针对智能对话场景中的用户文本,自动判断该文本的情绪类别并给出相应的置信度,情绪类型分为积极、消极、中性。 对话情绪识别适用于聊天、客服等多个场景,能够帮助企业更好地把握对话质量、改善产品的用户交互体验,也能分析客服服务质量、降低人工质检成本。

下面以一个文本情感分类任务为例子来说明BERT模型的整个应用过程。

1 数据集

这里提供一份已标注的、经过分词预处理的机器人聊天数据集,来自于百度飞桨团队。数据由两列组成,以制表符('\t')分隔,第一列是情绪分类的类别(0表示消极;1表示中性;2表示积极),第二列是以空格分词的中文文本,如下示例,文件为 utf8 编码。

label--text_a

0--谁骂人了?我从来不骂人,我骂的都不是人,你是人吗 ?

1--我有事等会儿就回来和你聊

2--我见到你很高兴谢谢你帮我

这部分主要包括数据集读取,数据格式转换,数据 Tokenize 处理和 pad 操作。(代码详原文链接)

  • 数据加载和数据预处理

新建 process_dataset 函数用于数据加载和数据预处理,具体内容可见代码注释。(代码详原文链接)

2 模型构建

  1. 通过 BertForSequenceClassification 构建用于情感分类的 BERT 模型,加载预训练权重,设置情感三分类的超参数自动构建模型。
  2. 后面对模型采用自动混合精度操作,提高训练的速度,然后实例化优化器
  3. 紧接着实例化评价指标,设置模型训练的权重保存策略。
  4. 最后就是构建训练器,模型开始训练(代码详原文链接)

3 模型验证

验证数据集加再进训练好的模型,对数据集进行验证,查看模型在验证数据上面的效果,此处的评价指标为准确率(代码详原文链接)

4 模型推理

遍历推理数据集,将结果与标签进行统一展示。(代码详原文链接)

5 自定义推理数据集

自己输入推理数据,展示模型的泛化能力。(代码详原文链接)

 

 

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐