wlw208dzy / TrashSMS

基于中文分词和训练的本地垃圾短息判断。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

README of TrashSMS

###brief 基于中文分词和训练的本地垃圾短息判断。

###Usage

  1. 将TrashSMS目录下的SMS.mm, SMS.h和scws拷贝到你的工程中

  2. 链接libscws.dylib

  3. Build and run

###Other libscws.dylib由scws目录下的工程编译得到

####release tips 在发布时应该把libscws.dylib放在/usr/lib/下

dict.utf8.xdb, rules.utf8.ini和TrashData.plist则应该放在/usr/bin/下(可以在SMS.mm中更改这几个文件的路径)

####关于TrashData.plist TrashSMS目录下的TrashData.plist是一个TrashData的示范, NSDictionary

Key是由分词得到的短语, value则是它的权值, 权值越高, 越可能是垃圾短信。

你可以使用tools下面的工程来训练识别垃圾短信(实际上, tools下的工程就是一开始调试时所使用的, 之后才创建的iOS工程)

具体的API信息请查看SMS.h, 写得还是比较详尽, 若有疑问请new issues

###Thanks Thanks scws project.

About

基于中文分词和训练的本地垃圾短息判断。


Languages

Language:C 89.3%Language:Objective-C++ 5.8%Language:Objective-C 3.6%Language:C++ 1.3%