» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

原来锤子big bang借鉴的是ios软件Pin啊,喷了

posted by wap, platform: Chrome
作者说得好,本身中文分词英文分词就是各语种都有的一种用法,多用于搜索引擎,这种东西有各种开源实现,就是把一段话中的词语单独区分开,然后再做xxxxx。

并不是pin独创的,不过pin单独做成APP再单独拿出来搜索应该还是有一定创意,但这个技术关键在分词,而分词又有一堆开源算法,而pin的作者估计也是用的开源算法,理论上这玩意搞不好本来就需要开源。


而且这玩意出出来,V2EX就有人很快用开源的分词算法实现了PC的pin,所以这真的没啥,算一个算法的灵活运用而已


TOP

posted by wap, platform: Chrome
有兴趣可以去github看:https://github.com/fxsjy/jieba



代码示例

# encoding=utf-8
import jieba

seg_list = jieba.cut("我来到北京清华大学", cut_all=True)
print("Full Mode: " + "/ ".join(seg_list))  # 全模式

seg_list = jieba.cut("我来到北京清华大学", cut_all=False)
print("Default Mode: " + "/ ".join(seg_list))  # 精确模式

seg_list = jieba.cut("他来到了网易杭研大厦"  # 默认是精确模式
print(", ".join(seg_list))

seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造"  # 搜索引擎模式
print(", ".join(seg_list))
输出:

【全模式】: 我/ 来到/ 北京/ 清华/ 清华大学/ 华大/ 大学

【精确模式】: 我/ 来到/ 北京/ 清华大学

【新词识别】:他, 来到, 了, 网易, 杭研, 大厦    (此处,“杭研”并没有在词典中,但是也被Viterbi算法识别出来了)

【搜索引擎模式】: 小明, 硕士, 毕业, 于, 中国, 科学, 学院, 科学院, 中国科学院, 计算, 计算所, 后, 在, 日本, 京都, 大学, 日本京都大学, 深造


很简单的,有了开源的库和算法,会编程的分分钟就能撸一个出来



TOP

posted by wap, platform: Chrome
引用:
原帖由 @pimp1234  于 2016-10-25 15:06 发表
大哥普及一下ios的pin怎么用吧。。下载以后一大堆设置但是又在Safari上用不了。。
http://sspai.com/32465

看这个,简直遍地都是教程


本帖最近评分记录
  • pimp1234 激骚 +1 最骚 Rated by wap 2016-10-26 11:20

TOP

posted by wap, platform: Chrome
引用:
原帖由 @第七个男孩  于 2016-10-25 16:12 发表
我看了下这个文章他复制好后下拉直接就是分好的词,这个怎么设置?我下拉显示的是剪贴板记录,要点几下才能分词
具体怎么设置我要回家翻翻了,我自己也就用默认的

TOP

posted by wap, platform: Chrome
引用:
原帖由 @第七个男孩  于 2016-10-25 16:12 发表
我看了下这个文章他复制好后下拉直接就是分好的词,这个怎么设置?我下拉显示的是剪贴板记录,要点几下才能分词
妈比没搞成,我闲置了几天iPad又让我重新输入密码,但是老不对,我去啊,每次都这样,等我整整,我都要哭了,每次重新用iOS就要折腾一次

TOP

发新话题
     
官方公众号及微博