通过混合信息提取和大型语言模型构建自动桥梁检查数据库
研究问题
如何利用大型语言模型辅助的信息提取方法,从非结构化的桥梁检查报告中高效准确地抽取关键数据,并用于建立维护所需的数据库?
提出方法
- 伪标签法:使用封闭源大型语言模型生成高质量标记数据,以便于下游模型训练。
- 混合信息提取管道:包括规则基和生成基智能模型,从非结构化的桥梁检查报告中有效提取数据。
创新点
- 使用封闭源大型语言模型生成的高质量伪标签数据进行高效训练。
- 提出了一种包含规则基和生成基模型的混合信息提取管道。
- 一种基于生成的信息提取模型,在伪标签数据上微调后,无论在效率还是精度方面都超越了传统的分类方法。
结论
该方法展示了比用于标记的封闭源LLM更高的提取精度,并且在数据准备时间和提取准确性方面都优于传统的方法。这为更积极和基于数据驱动的桥梁维护策略做出了贡献。
原文链接
https://www.sciencedirect.com/science/article/pii/S2666165924002308
使用大规模语言模型进行文本中说服性和误导性词汇的自动标记检测
研究问题
如何利用大规模语言模型在词元级别处理来有效识别和分类文本中的说服性和误导性词语,以更好地理解其对公众舆论、消费者行为及政治话语的影响?
提出方法
本研究采用基于变换器模型的词元级处理技术,并结合注意力机制与上下文嵌入,旨在全面分析并标记具有潜在说服力或误导性的单词。这种方法不仅能够检测细微的语言修辞策略,还能提供对语言如何在更深层次结构中运作的理解。
创新点
- 在基于变换器模型内使用词元级处理。
- 通过整合注意力机制和上下文嵌入进行详细的分析。
- 提供高效且可扩展的解决方案,用于自动内容审核、政治话语分析和广告监管。
- 应用范围扩大到媒体分析和虚假信息检测。
结论
该研究开发的方法为识别文本中的说服性和误导性语言提供了一种强大而有效的工具。它不仅提升了对这些语言特征的理解能力,还扩展了其应用领域至更广泛的文本分析场景中,如自动内容审核、政治话语评估及广告监管等。
原文链接
https://www.researchsquare.com/article/rs-5174770/latest
用于将分类数据转换为可解释特征向量的大型语言模型
标题
当分析包含数值和分类属性的异构数据时,通常会单独处理不同的数据类型或将分类属性转换为数值属性。本研究提出了一种使用大型语言模型(LLMs)将分类数据转换为可解释的数值特征向量的新技术。
研究问题
在处理异构数据集时,如何有效地将其分类属性转化为数值形式以进行多变量分析?
提出方法
我们利用大型语言模型来识别分类属性的主要特性,并为其分配数值值,从而生成多维特征向量。该转换可以完全自动计算,但由于特性的可解释性,用户也可以直观地调整此过程。此外,我们提供了一个交互式工具,以验证和改进AI生成的输出。
创新点
- 提出了使用大型语言模型进行分类数据到数值特征向量转化的新技术。
- 通过特性分配数值值,使转换过程具有可解释性,并且用户可以直观地调整结果。
- 设计了一个交互式工具以验证和改进AI生成的输出。
结论
本研究提出的方法为处理包含分类属性的数据集提供了一种新的思路。通过对大型语言模型的应用以及特征向量的生成,该方法能够有效地将分类数据转化为数值形式,并支持多变量分析。此外,这种方法还具有高度可解释性,使得用户可以直观地调整和验证AI生成的结果。
通过这种方式,我们可以更全面、高效地分析包含多种类型属性的数据集,推动数据分析领域的进一步发展。
原文链接
https://pubmed.ncbi.nlm.nih.gov/39348252/
数据分析中的聊天模型研究:复杂和专业应用案例
研究问题
- 哪些提示技术最适合用于数据分析中的聊天模型?
- 在特定应用中,哪些语言模型显示出最有效且成本效益高的性能?
提出方法
不同的提示技术被应用于多种语言模型(GPT-3.5-Turbo、Nous-Hermes、WizardLM 和 Falcon),并分析了在提取专业数据时 JSON 结构的结果。
创新点
该研究首次探讨了特定提示技术对聊天模型在数据分析中的影响,特别是在具有高专业知识和复杂性的领域中。
6. 结论
即使在当前形式下,聊天模型也可以通过少样本提示技术,在复杂且专业的应用场景中提供高潜力支持,并作为数据分析中的经济有效工具使用。
原文链接
https://mn.h-da.de/fileadmin/Dokumente/Studium/DS/MDS_SS2024_Thesis_Nils_Hartmann_POS.pdf