复旦华工联手，AI内容检测器ImBD问世

好的，请看我为你撰写的这篇新闻报道：

复旦、华南理工等联合推出ImBD：通用AI内容检测器，精准识别机器润色文本

导语： 在人工智能技术飞速发展的今天，大型语言模型（LLMs）在文本创作和编辑领域的应用日益广泛。然而，随之而来的挑战是如何区分人类写作和机器润色内容，以维护学术诚信、新闻真实性和信息安全。近日，复旦大学、华南理工大学、武汉大学以及Fenzi AI等机构联合推出了一款名为ImBD（Imitate Before Detect）的通用AI内容检测器，为解决这一难题提供了新的解决方案。

正文：

ImBD，正如其名“先模仿，再检测”，其核心理念是通过模仿大型语言模型（LLMs）生成文本的风格，从而更精准地识别机器润色的文本。这款工具的推出，标志着在AI内容检测领域迈出了重要一步。

技术原理：

ImBD的技术核心在于两个关键步骤：

风格偏好优化（SPO）： ImBD首先模仿LLMs的文本生成风格。通过分析大量人类写作和机器润色文本，ImBD利用风格偏好优化（SPO）技术，调整其评分模型，使其能够更准确地识别机器润色文本的特征。具体来说，该模型会学习机器润色文本的独特风格，例如，在词汇选择、句式结构和表达方式上的特定偏好。
风格条件概率曲率（Style-CPC）： 在检测阶段，ImBD利用风格条件概率曲率（Style-CPC）来量化原始文本与条件概率采样生成文本之间的对数概率差异。这种差异能够有效区分人类写作和机器润色内容，因为机器润色文本在概率分布上通常会表现出与人类写作不同的特征。简单来说，人类写作的文本在概率分布上往往更加自然和多样，而机器润色的文本则可能存在一定的模式和规律。

ImBD的优势：

高准确性： ImBD能够有效识别经过机器修订的文本，包括重写、扩展和润色等类型，显著提高检测性能。
广泛适用性： ImBD适用于多种文本领域和不同类型的机器修订任务，包括新闻、学术论文、故事创作等。
高效性： ImBD在训练过程中仅需少量样本和较短的训练时间，即可达到优越的性能。在推理阶段，ImBD能够快速处理文本数据，给出检测结果，满足实际应用中对效率的要求。

应用场景：

ImBD的应用场景非常广泛，包括：