`
文章列表
Often unknown, or heralded as confusing, regular expressions have defined the standard for powerful text manipulation and search. Without them, many of the applications we know today would not function. This two-part series explores the basics of regular expressions in Java, and provides tutorial exa ...
转自:http://blog.csdn.net/qinjuning/article/details/7310620   大家好,  今天给大家介绍下我们在应用开发中最熟悉而陌生的朋友-----Context类 ,说它熟悉,是应为我们在开发中    时刻的在与它打交道,例如:Service、BroadcastReceiver、Activity等都会利用到Context的相关方法 ; 说它陌生,完全是    因为我们真正的不懂Context的原理、类结构关系。一个简单的问题是,一个应用程序App中存在多少个Context实例对象呢?    一个、两个? 在此先卖个关子吧。读了本文,相信您会豁然开朗 ...
今天读Heritrix看到这么个类,设计非常棒,多个集合的合并其实并不需要新建集合对象,并进行数据搬移。 public class CompositeIterator<E> implements Iterator<E> {     protected ArrayList<Iterator<E>> iterators = new ArrayList<Iterator<E>>();     protected Iterator<E> currentIterator;     protected int indexO ...
转自:http://freewind886.blog.163.com/blog/static/661924642011810236100/ int -> byte 可以直接使用强制类型转换: byte b = (byte) aInt; 这个操作是直接截取int中最低一个字节,如果int大于255,则值就会变得面目全非了。 对于通过InputStream.read()获取的int,可采用这个方法将值还原。 byte -> int 这里有两种情况,一种是要求保持值不变,例如进行数值计算,可采用强制类型转换:int i = (int) aByte; 另一种是要求保持最低字节中各个位不变, ...
【mysqldump导出数据】 备份数据库 Linux代码 #mysqldump 数据库名 >数据库备份名       #mysqldump -A -u用户名 -p密码 数据库名>数据库备份名       #mysqldump -d -A --add-drop-table -uroot -p >xxx.sql   #mysqldump 数据库名 >数据库 ...
若按默认配置: dbfilename dump.rdb 这时dump.rdb存放位置是不固定的,而是存放在启动redis时的当前目录
转自:http://weipengfei.blog.51cto.com/1511707/1217504 (基于Redis 2.6) 基础部分设置: daemonize no #默认情况下redis 不是以守护进程的模式运行。 pidfile /var/run/redis.pid #在守护进程模式下,pid进程号文件路径的存储位置 port 6379 #监听的端口号,设置为0的话,redis不会对tcp 连接进行监听; bind 127.0.0.1  #绑定本机单一网卡适配器,默认是本机的所有网络适配器 unixsocket /tmp/redis.sock unixsocketperm ...
转自:http://hi.baidu.com/hehehehello/item/3b0d1f8ba1c2e5c698255f89 CRF(Conditional Random Field) 条件随机场是近几年自然语言处理领域常用的算法之一,常用于句法分析、命名实体识别、词性标注等。在我看来,CRF就像一个反向的隐马尔可夫模型(HMM),两者都是用了马尔科夫链作为隐含变量的概率转移模型,只不过HMM使用隐含变量生成可观测状态,其生成概率有标注集统计得到,是一个生成模型;而CRF反过来通过可观测状态判别隐含变量,其概率亦通过标注集统计得来,是一个判别模型。由于两者模型主干相同,其能够应用的领域往 ...
    <Connector port="8080" protocol="HTTP/1.1" address="127.0.0.1"                connectionTimeout="20000"                redirectPort="8443"  uRIEncoding="utf-8"/>
转自:http://hi.baidu.com/catro/item/5c76247c0ff6a9376f29f6ed MMSEG是中文分词中一个常见的、基于词典的分词算法(作者主页:http://chtsai.org/index_tw.html),简单、效果相对较好。由于它的简易直观性,实现起来不是很复杂,运行速度也比较 ...
转自:http://www.ooreport.com/bbs/topicView.aspx?Id=91400 切分歧义字段的综合性分级处理方法 --北京大学计算语言学研究所讨论班, 99.4.13 孙 斌 北京大学计算语言学研究所 (*)在这次讨论班要报告的内容: 一、 汉语自动分词的必要 ...
=============================================================================== 转自: 作者:刀剑笑(Blog:http://blog.csdn.net/jyz3051) Email:jyz3051 at yahoo dot com dot cn('at'请替换成'@','dot'请替换成'.' ) ======================================================================= ...
http://blog.sina.com.cn/s/blog_a48ff37201010cxv.html
转自:http://www.cnblogs.com/allensun/archive/2011/02/16/1956532.html 布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常被用到。哈希表也能用于判断元素是否在集合中,但是布隆过滤器只需要哈希表的1/8或1/4的空间复杂度就能完成同样的问题。布隆过滤器可以插入元素,但不可以删除已有元素。其中的元素越多,false posit ...
错误: The resource identified by this request is only capable of generating responses with characteristics not acceptable according to the request "accept" headers ().   网上一般的解决方法:   首先引入 jackson-core-asl-1.6.4.jar jackson-mapper-asl-1.6.4.jar 如果是: <mvc:annotation-driven /> 那 ...
Global site tag (gtag.js) - Google Analytics