雷火小说网

手机浏览器扫描二维码访问

第27章(第2页)

作为一名合格的科研工作者,谢与非首先开始做文献收集工作。

Sci-Hub是用不了了,KI上的文献也不算很多,于是谢与非只好从最基础的做起——先筛选知名小说网站和APP。

不多时就进入到了着名的网文论坛,从中筛选出基本符合要求的平台若干。

然后再细分,哪些网站以霸总小白文见长,哪些受众比较多样化。

接着呢,就是科研狗们最喜欢的收集数据阶段。

谢与非花了两个晚上,研究了各类榜单的排名和更新依据,从论坛里搜集了大量资料,甚至搞明白了几大平台女频的各种打榜暗箱操作。

于是她——开始看小说了?

不,蠢蠢欲动想要写个刷票小程序和网站的算法较量一下,看能不能被识破。

但是理智告诉她,做研究要不忘初心,总结霸总的行为规律才是首要任务,于是又回归到了霸总文本身。

开始的时候,谢与非做了个Excel表,里面列了各个网站排名前十的霸总文,并且按照简介和名字做了分类。

通过阅读大量的书评,扫文号和论坛讨论贴可知,霸总文只是一个大项目,里面还分有不同的小类与流派。

根据题材可以分为重生,穿越,现实,古代等等,穿越下面还有,等小类。

根据风格还可以分为「甜宠型」,「强迫型」,「型」,「契约情人型」等等。分析平台的榜单排名可知,目前「虐恋型」已经过时,「甜宠型」和「火葬场型」正在当红。

表列到这里,谢与非发现单纯的表格已经不能满足她了,这种复杂的分类需要一个坐标系。

于是画起了横轴和纵轴。

除了文章风格,作为霸总文灵魂的「霸总」当然也需要分类。

什么型霸总,粗暴型霸总,外冷内热型霸总,智商极高型霸总,反正也是需要一个坐标系来画明白的。

画着画着图她的思维又开始奔逸了,像霸总文这种具有高度同质性并且特徵明显的小说,是不是可以先收集大量数据建立一个语料库,然后再写一个算法让AI自动出产霸总文,只要输入想要的属性标签,然后就可以自动从语料库里摘取句子生成语段。同理可证那些打脸文丶丶文都可以一样产出。

小贴士:如果觉得不错,记得收藏网址或推荐给朋友哦~拜托啦(.)

:||

人间很值得  当绿茶女配开始自暴自弃  路人甲心声泄露后成为了救世主  花田喜事  折骨  男配怀了我的崽  在年代文离婚后的幸福生活  猫爪爪的诱惑  [综英美] 跟着红桶学做人  影后娘娘升职记  欲拒还迎后男主精分了  七十年代创业忙  请认真搞笑  绿茶女配的前男友们  瑞雪临  这一次,我选反派[重生]  首席生活玩家[全息]  星际第一符籙机甲师  沉橘  御厨大人她有新派料理[美食]  

热门小说推荐
另谋高嫁:这侯府夫人我不做了!

另谋高嫁:这侯府夫人我不做了!

传统古言宅斗女强男强双向奔赴王爷宠妻商贾之女高嫁侯府,成了上京笑谈。独守空房供养侯府六年,姜舒无怨无悔。可她苦等多年的夫君从边关归来,带回一妻两子。不仅如此,沈长...

全职艺术家

全职艺术家

音乐影视绘画书法雕塑文学你都懂?略知一二。都会一点的意思?嗯,都会亿点的意思。怀揣系统,靠艺术征服世界,成为各界人士顶礼膜拜的无冕之王。...

火影:万物皆可复制

火影:万物皆可复制

出身番茄孤儿院的角木,被泥头车送到忍界。有一个沉稳可靠,有时喜欢搞些小操作的老爸。有一个温柔体贴有主见,偶尔会小腹黑的老妈。有一个活泼调皮,崇拜哥哥的弟弟。虽然还有房贷要还,但仍是个幸福美满,温暖的家。只是,弟弟的名字叫海野伊鲁卡。自己的名字,是海野角木。从未来的九尾之乱中拯救自己的家人,便是海野角木踏足忍界要...

大豪门

大豪门

馅饼,说好的豪门风云世家恩怨呢?有。自己看书!馅饼,说好的江湖快意儿女情仇呢?有。自己看书!馅饼,说好的纨绔嚣张衙内跋扈呢?有。自己看书!馅饼,说好的狗血装逼扮猪吃虎呢?有。自己看书!馅饼,说好的医卜星象天机莫测呢?嚓,你有完没完?有,都有!不会自己看书啊?好,我看书去了,看得不爽,削你!那看得爽了呢?要不要给票?...

女侠且慢

女侠且慢

女侠且慢,你可知我是什么人?知道,女帝身边的宠臣,反贼头目的相好,江湖名门的少主。脚踏三只船,我砍得就是你!...

每日热搜小说推荐