java抓取网页或文件中的邮箱号码
发布时间 - 2026-01-11 00:24:43 点击率:次本文实例为大家分享了java抓取邮箱号码的具体代码,供大家参考,具体内容如下

java抓取文件中邮箱号码的具体代码
package reg;
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class TestEmail {
public static void main(String[] args) {
// TODO Auto-generated method stub
BufferedReader br=null;
try {
br=new BufferedReader(new FileReader("D:/1.htm"));
String str=null;
StringBuilder sb=new StringBuilder();
while((str=br.readLine())!=null){
sb.append(str);
}
List es=getEmail(sb.toString());
for(String e:es){
System.out.println(e);
}
} catch (FileNotFoundException e) {
// TODO: handle exception
e.printStackTrace();
}catch (IOException e) {
// TODO: handle exception
e.printStackTrace();
}finally {
try {
if(br!=null) br.close();
} catch (IOException e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
public static List getEmail(String str){
List es=new ArrayList();
Pattern p=Pattern.compile("[\\w\\.-]*\\w+@[\\w\\.-]*\\w+\\.\\w{2,5}");
// Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
Matcher m=p.matcher(str);
while(m.find()){
es.add(m.group());
}
return es;
}
}
java抓取网页中邮箱号码的具体代码
package reg;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Testemail01
{
public static String getWebCon(String domain)
{
System.out.println("开始抓取邮件地址..("+domain+")");
StringBuffer sb=new StringBuffer();
try
{
java.net.URL url=new java.net.URL(domain);
BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream()));
String line;
while((line=in.readLine())!=null)
{
parse(line);
}
in.close();
}
catch(Exception e)
{
sb.append(e.toString());
System.err.println(e);
}
return sb.toString();
}
public static void main(String[] args)
{
String s=Testemail01.getWebCon("http://tieba.baidu.com/p/2366935784");
}
private static void parse(String line)
{
Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//邮箱的正则表达式
Matcher m=p.matcher(line);
while(m.find())
{
System.out.println(m.group());
}
}
}
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
# java抓取网页中邮箱号码
# java抓取文件中邮箱号码
# java抓取邮箱号码
# Java模拟新浪微博登陆抓取数据
# java利用url实现网页内容的抓取
# 详解Java实现多种方式的http数据抓取
# 详解JAVA抓取网页的图片
# JAVA利用正则表达式抓取网站图片
# java爬虫Gecco工具抓取新闻实例
# java实现登录之后抓取数据
# 大家分享
# 具体内容
# 大家多多
# 正则表达式
# String
# main
# args
# TODO
# void
# public
# Pattern
# static
# TestEmail
# null
# str
# htm
# br
# generated
# Auto
# stub
相关栏目:
【
网站优化151355 】
【
网络推广146373 】
【
网络技术251813 】
【
AI营销90571 】
相关推荐:
php打包exe后无法访问网络共享_共享权限设置方法【教程】
简单实现Android文件上传
Laravel怎么定时执行任务_Laravel任务调度器Schedule配置与Cron设置【教程】
如何在VPS电脑上快速搭建网站?
香港服务器租用每月最低只需15元?
香港服务器网站生成指南:免费资源整合与高速稳定配置方案
详解Huffman编码算法之Java实现
利用vue写todolist单页应用
Laravel如何升级到最新版本?(升级指南和步骤)
美食网站链接制作教程视频,哪个教做美食的网站比较专业点?
Laravel如何处理CORS跨域请求?(配置示例)
深圳防火门网站制作公司,深圳中天明防火门怎么编码?
手机网站制作与建设方案,手机网站如何建设?
如何在IIS7上新建站点并设置安全权限?
Angular 表单中正确绑定输入值以确保提交与验证正常工作
Laravel如何生成和使用数据填充?(Seeder和Factory示例)
网站制作免费,什么网站能看正片电影?
JavaScript Ajax实现异步通信
如何撰写建站申请书?关键要点有哪些?
实例解析angularjs的filter过滤器
手机钓鱼网站怎么制作视频,怎样拦截钓鱼网站。怎么办?
Bootstrap整体框架之JavaScript插件架构
如何用景安虚拟主机手机版绑定域名建站?
Android自定义listview布局实现上拉加载下拉刷新功能
Laravel怎么做缓存_Laravel Cache系统提升应用速度的策略与技巧
php做exe能调用系统命令吗_执行cmd指令实现方式【详解】
东莞市网站制作公司有哪些,东莞找工作用什么网站好?
昵图网官网入口 昵图网素材平台官方入口
Laravel观察者模式如何使用_Laravel Model Observer配置
如何在Windows服务器上快速搭建网站?
Laravel如何优化应用性能?(缓存和优化命令)
详解jQuery中的事件
javascript中的try catch异常捕获机制用法分析
google浏览器怎么清理缓存_谷歌浏览器清除缓存加速详细步骤
Laravel如何为API生成Swagger或OpenAPI文档
潮流网站制作头像软件下载,适合母子的网名有哪些?
googleplay官方入口在哪里_Google Play官方商店快速入口指南
Laravel Telescope怎么调试_使用Laravel Telescope进行应用监控与调试
使用豆包 AI 辅助进行简单网页 HTML 结构设计
如何在HTML表单中获取用户输入并结合JavaScript动态控制复利计算循环
如何在IIS管理器中快速创建并配置网站?
如何在 Go 中优雅地映射具有动态字段的 JSON 对象到结构体
Laravel路由Route怎么设置_Laravel基础路由定义与参数传递规则【详解】
IOS倒计时设置UIButton标题title的抖动问题
如何注册花生壳免费域名并搭建个人网站?
非常酷的网站设计制作软件,酷培ai教育官方网站?
网站制作大概多少钱一个,做一个平台网站大概多少钱?
深圳网站制作公司好吗,在深圳找工作哪个网站最好啊?
详解免费开源的DotNet二维码操作组件ThoughtWorks.QRCode(.NET组件介绍之四)
如何快速搭建FTP站点实现文件共享?

