`

java 中文 匹配(转)

 
阅读更多

匹配中文字符的正则表达式: [\u4e00-\u9fa5] 

 

匹配双字节字符(包括汉字在内):[^\x00-\xff] 

 

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 

 

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;} 

 

匹配空行的正则表达式:\n[\s| ]*\r 

 

匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/ 

 

匹配首尾空格的正则表达式:(^\s*)|(\s*$) 

 

应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下: 

 

String.prototype.trim = function() 

return this.replace(/(^\s*)|(\s*$)/g, ""); 

 

利用正则表达式分解和转换IP地址: 

 

下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序: 

 

function IP2V(ip) 

re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式 

if(re.test(ip)) 

return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1 

else 

throw new Error("Not a valid IP address!") 

 

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下: 

 

var ip="10.100.20.168" 

ip=ip.split(".") 

alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1)) 

 

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 

 

匹配网址URL的正则表达式:http://([/w-]+/.)+[/w-]+(/[/w- ./?%&=]*)? 

 

利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见本贴回复] 

 

var s="abacabefgeeii" 

var s1=s.replace(/(.).*\1/g,"$1") 

var re=new RegExp("["+s1+"]","g") 

var s2=s.replace(re,"") 

alert(s1+s2) //结果为:abcefgi 

 

这个方法对于字符顺序有要求的字符串可能不适用。 

 

得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1 

 

s="http://www.9499.net/page1.htm" 

s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2") 

alert(s) 

 

利用正则表达式限制网页表单里的文本框输入内容: 

 

用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,´´)" onbeforepaste="clipboardData.setData(´text´,clipboardData.getData(´text´).replace(/[^\u4E00-\u9FA5]/g,´´))" 

 

用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,´´)" onbeforepaste="clipboardData.setData(´text´,clipboardData.getData(´text´).replace(/[^\uFF00-\uFFFF]/g,´´))" 

 

用正则表达式限制只能输入数字:onkeyup="value=value.replace(/[^\d]/g,´´) "onbeforepaste="clipboardData.setData(´text´,clipboardData.getData(´text´).replace(/[^\d]/g,´´))" 

 

用正则表达式限制只能输入数字和英文:onkeyup="value=value.replace(/[\W]/g,´´) "onbeforepaste="clipboardData.setData(´text´,clipboardData.getData(´text´).replace(/[^\d]/g,´´))"

分享到:
评论

相关推荐

    iObjects Java 实现中文地址匹配

    该范例主要是用SuperMap iObjects Java 9D中新功能在中文地址匹配加载时支持追加索引和用户自定义多级分组功能。

    java中文分词之正向最大匹配法实例代码

    中文分词应用很广泛,网上也有很多开源项目,下面这篇文章主要给大家介绍了关于java中文分词之正向最大匹配法的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧。

    Java正则表达式面试题解析:探索复杂匹配规则与高效字符串处理

    从贪婪匹配和非贪婪匹配的概念到匹配数字、字母、汉字等特定模式,再到匹配邮箱地址、URL链接、手机号码等常见场景,每个问题都会给出相应的正则表达式和解析步骤。通过学习这些问题和解析,你将掌握复杂匹配规则的...

    中文地址分词及匹配项目

    处理中文地址的分词和匹配 采用混合分词算法进行中文地址分词 在中文地址分词基础上采用Double Levenshetin算法进行中文地址相似度进行地址匹配

    JAVA编写的基于文本相似度匹配的文本聚类

    使用JAVA编写的,分词、TFIDF相似度计算,K临近法聚类

    java 正向匹配算法分析

    java分词算法, 正向匹配,可以实现中文分词处理

    java比较文件_读取输出文件_正则表达式匹配

    2.java正则表达式匹配* 2个文件内容是:中文 英文,然后分别比较中文部分和英文部分,文件内容如下: 520香烟 520cigarette 678月 678yue A-zone A-zone A.O.史密斯 AOsms ACE床垫 ACE AOL时代华纳 Time Warner BMG...

    java汉字笔画排序源码

    原文地址:http://blog.csdn.net/u013271384/article/details/76549368

    JAVA_API1.6文档(中文)

    java.util.regex 用于匹配字符序列与正则表达式指定模式的类。 java.util.spi java.util 包中类的服务提供者类。 java.util.zip 提供用于读写标准 ZIP 和 GZIP 文件格式的类。 javax.accessibility 定义了用户...

    Java 1.6 API 中文 New

    java.util.regex 用于匹配字符序列与正则表达式指定模式的类。 java.util.spi java.util 包中类的服务提供者类。 java.util.zip 提供用于读写标准 ZIP 和 GZIP 文件格式的类。 javax.accessibility 定义了用户界面...

    提供汉字、拼音、拼音首字母的模糊查询(匹配左侧)

    文本框Enter、列表框双击或者Enter、按钮点击皆可搜索,模糊搜索后可上下键选择列表框中某一项,提供汉字、拼音、拼音首字母的模糊查询(匹配左侧)

    java代码产生汉字库

    java代码实现汉字库,编码方式有GB2312,GBK,Unicode,UTF-8,利用以上编码规则产生汉字库,目前是第一版本,只产生汉字库,第二版本实现随机汉字验证码,根据拼音检索匹配的汉字.

    拼音模糊匹配

    拼音模糊匹配js

    多模式匹配算法(支持中文多关键字匹配)

    经典的WM算法的源代码,原先就在csdn...经过改进之后,可以完美的支持中英文混合的多模式匹配,而且支持从文件中读取样本数据以及模式数据,经过测试相当的快。4MB的中文2000条关键字,只需0.1秒左右的时间,赞一个!!

    前向最大匹配中文分词

    自己写的前向最大匹配中文分词程序,内含简单的词典

    中文拼音首字母匹配中国城市名

    中文/拼音首字母匹配中国城市名 js检索方式词条的存储/更新

    java7源码-RegionMatch:中国省市区匹配

    java7 源码 中国省市区(行政区划)匹配 这个项目来源于公司的内部需求,具体为在具备信息提取能力的系统中,使用省、市、区中一个或多个关键字来匹配具体民政部区域编码的功能。 开源版是在内部版的核心思想上,...

    JavaAPI1.6中文chm文档 part1

    java.util.regex 用于匹配字符序列与正则表达式指定模式的类。 java.util.spi java.util 包中类的服务提供者类。 java.util.zip 提供用于读写标准 ZIP 和 GZIP 文件格式的类。 javax.accessibility 定义了用户...

    Java正则匹配中文的方法实例分析

    主要介绍了Java正则匹配中文的方法,结合实例形式分析了Java针对中文、标点及引号等匹配操作相关技巧,需要的朋友可以参考下

    Java使用正则表达式(regex)匹配中文实例代码

    本文给大家分享java使用正则表达式匹配中文的实例代码,以及java中要匹配中文的正则表达式两种写法,感兴趣的朋友通过本文一起看看吧

Global site tag (gtag.js) - Google Analytics