为什么先前观光者留下的体验和感触感染很主要o在万为这些身临其境的感触感染才干给后来者供给带进感,好比蚂蜂窝可以从 UGC 的纪行攻略里提掏出相似:“酒店间隔新宿趁魅站很近,乘坐地铁和 JR 线都很是便利,便利往新宿购物。酒店有地下通道可以纵贯新宿站,带着很年夜的箱子行走也不会太吃力”如许的句子,这是纯洁做买卖的 OTA 很难做到的。
而要能从已有的长篇年夜论的攻略中提掏出上述有用的酒店评价信息,就须要蚂蜂窝有一个技巧体系来将有价值的数据进行构造化。
陈罡嗣魅这个体系就是他们一开端就在做的“攻略引擎”(这个引擎在 2013 年有过一次周全的进级),由于他们自己是做搜刮引擎出生的团队,今朝团队里也有对折是研发的技巧职员。而在搜刮范畴里,语义剖析是很主要的一环——就好比“空”和“多”这两个相对的词,在金融范畴,和在旅游范畴,表义是完整纷歧样的。所以他们把语义剖析用在了攻略的数据剖析里,好比要怎么往鉴定用户写到“喷鼻格里拉”时指的是酒店仍是地名?这些都须要技巧往提取、然后构造化。
我看了一下蚂蜂窝构造化数据的后果,有两个比拟直不雅的例子,一个是用户此刻可以直接在攻略里看到被提掏出来的酒店 POI 信息,点击链接便可以直接导进预订页面。另一个是蚂蜂窝针对餐厅的点评页面里,它提掏出了一些最常被说起的字眼作为直不雅参考,好比“贵啊”、“味道一般”、“十年陈酿”、“”这些字眼,后果接近淘宝的评价体系。