首页

  • <tt class='tlJykMlA'></tt>
  • <thead class='94K7Lauipx'><option class='9cNvbSu7LJ'></option></thead>

    <em class='jepytdnyfeW3'><b class='oR1Ys12nk'><td class='6rzzLTN'></td></b></em>

  • <dl class='Td0EmkF'><b class='qoWhaibfJ9'></b></dl>

  • <span class='lS1G'></span>

    Clickbait的一秘密曝光了 人类和AI联手改善点击诱饵检测

    宾夕法尼亚州立大学和亚利桑那州立大学的一研究人员说,人类和机器共同协作,以帮助训练一种优于其他点击诱饵检测器的一人工智能模型 。他们说,此外,新的一基于AI的一解决方案还能够分辨出由机器(或机器人)生成的一clickbait标题与由人编写的一clickbait标题之间的一区别 。

    在一项研究中,研究人员要求人们编写自己的一点击诱饵-这是一个有趣但具有误导性的一吉林11选5开奖结果标题,旨在吸引读者点击其他在线故事的一链接 。研究人员还对机器进行了编程以生成人工点击诱饵 。然后,将人和机器的一标题作为数据来训练点击诱饵检测算法 。

    研究人员表示,由此产生的一算法预测点击诱饵标题的一能力 比其他系统好14.5%,研究人员今天(8月28日)在2019年IEEE / ACM国际社交网络分析先进会议(ASONAM)上发布了他们的一发现 。加拿大温哥华 。

    该项目的一首席研究员,信息科学与技术学院副教授Dongwon Lee表示,除了将其用于点击诱饵检测之外,该团队的一方法还可能有助于总体上提高机器学习性能 。Lee还是宾夕法尼亚州立大学计算机科学研究所(ICS)的一附属机构,该研究所为宾夕法尼亚州立大学的一研究人员提供了超级计算资源的一访问权限 。

    “我们成功地证明了机器生成的一点击诱饵训练数据可以反馈到训练管道中,以训练各种各样的一机器学习模型来提高性能,这一结果非常有趣 。” Lee说 。“这是解决需要大量高质量培训数据的一监督型机器学习的一基本瓶颈的一一步 。”

    宾夕法尼亚州立大学信息科学与技术学院的一一名博士生Thai Le表示,点击诱饵检测技术的一发展面临的一挑战之一是缺乏标记数据 。就像人们需要老师和学习指南来帮助他们学习一样,人工智能模型也需要带有标签的一数据来帮助他们学习建立正确的一联系和关联 。

    Le说:“当我们开始这个项目时,我们意识到的一一件事是,我们没有很多积极的一数据点 。”“为了识别点击诱饵,我们需要让人员标记训练数据 。有必要增加正面数据点的一数量,以便以后我们可以训练更好的一模型 。”

    尽管在互联网上找到点击诱饵很容易,但点击诱饵的一多种变化又●增加了另一层难度,据Donald P媒体效应教授兼媒体效应研究实验室联合主任James P. Jimirro的一S. Shyam Sundar称 。 Bellisario通信学院,以及ICS子公司 。

    “有一些点击诱饵是列表或列表;有一些点击诱饵被表述为问题;有一些以谁,什么地方,何时开始;还有我们在研究中发现的一各种其他种类的一点击诱饵 。年 。”桑达尔说 。“因此,要找到足够数量的一所有这些类型的一Clickbait样本是一个挑战 。尽管我们都在抱怨周围的一Clickbait数量,但是当您四处获取并标记它们时,这些数据集并不 多 。”

    根据研究人员的一说法,该研究揭示了人和机器在创建标题方面的一差异 。与机器产生的一点击诱饵相比,人们产生的一标题倾向于在其标题中包含更多确定性词(例如“ that”和“ that”) 。

    培训似乎也促使点击诱饵的一创建有所不 同 。例如,受过训练的一作家(例如记者)比其他参与者倾向于使用更长的一单词和更多的一代词 。记者也可能会使用数字作为头条吉林11选5开奖结果 。

    据Sundar称,研究人员计划利用这些发现来指导他们对更强大的一假吉林11选5开奖结果检测系统的一研究 。

    Sundar说:“对我们来说,点击诱饵只是构成虚假吉林11选5开奖结果的一众多因素之一,但是这项研究是确保我们建立良好的一点击诱饵检测系统的一有用准备步骤 。”

    为了寻找人类点击诱饵作者进行研究,研究人员从在线人群资源网站Amazon Turk招募了吉林11选5开奖结果专业的一学生和工人 。他们从现场招募了125名学生和85名工人 。参与者首先阅读了clickbait的一定义,然后被要求阅读了简短的一文章(约500个单词) 。然后要求参与者为每篇文章写一个点击诱饵标题 。

    机器生成的一点击诱饵标题是使用称为变分自动编码器(VAE)生成模型的一机器学习模型开发的一,该模型依赖于在数据中查找模式的一可能性 。

    研究人员针对在线点击诱饵检测竞赛Clickbait Challenge 2017的一顶级系统测试了他们的一算法 。

    宾夕法尼亚州大众传播学的一博士候选人Maria Molina也为这项研究做出了贡献 。亚利桑那州立大学的一计算机科学与工程教授刘欢和计算机科学与工程博士学位候选人凯舒 。

    国家科学基金会,橡树岭联合大学和海军研究办公室支持这项工作 。

    郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的一,如作者信息标记有误,请第一时间联系吉林11选5开奖结果修改或删除,多谢 。

    <td id="7163h" ></td>
    1. <font id="7163h" ></font>
    2. <delect id="7163h" ><dl id="7163h" ><strong id="7163h" ></strong></dl></delect>
      <legend id="7163h" ><td id="7163h" ></td></legend>
    3. <ins id="7163h" ><mark id="7163h" ></mark></ins>
      <u id="7163h" ></u><track id="7163h" ><p id="7163h" ><ol id="7163h" ></ol></p></track>
    4. <dd id="7163h" ></dd>
      <samp id="7163h" ><label id="7163h" ></label></samp>
      <th id="7163h" ><var id="7163h" ></var></th>