`
zhangq168
  • 浏览: 26712 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

java HttpClient获取网页源代码

阅读更多

HttpClient 是 Apache Jakarta Common 下的子项目,用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议。项目首页是http://hc.apache.org/httpclient-3.x/,下载地址:http://hc.apache.org/downloads.cgi,本人下载的是  HttpClient 4.0.1 (GA)

 

首先声明一下,下载包里面有现成的例子,貌似4.0 和以前的版本差别很大,因为在网上找的别的例子,在4.0版本里面连一些类都找不到了

import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.DefaultHttpClient;

public class ClientAbortMethod {

    public final static void main(String[] args) throws Exception {
        HttpClient httpclient = new DefaultHttpClient();

        HttpGet httpget = new HttpGet("http://www.apache.org/"); 

        System.out.println("executing request " + httpget.getURI());
        HttpResponse response = httpclient.execute(httpget);
        HttpEntity entity = response.getEntity();

        System.out.println("----------------------------------------");
        System.out.println(response.getStatusLine());
        if (entity != null) {
            BufferedReader reader = new BufferedReader(
                    new InputStreamReader(entity.getContent()));
           String str = null;
           if(null != (str = reader.readLine()) ){
               System.out.println(str);
            }

        }
        System.out.println("----------------------------------------");

        httpget.abort();
        
        httpclient.getConnectionManager().shutdown();        
    }

}

 

代码中有未引入的类和异常,大家自己处理一下就OK了

如此便可打印出网页所有源代码,当然这只是最简单的一种情况

 使用的时候除了要加入http-client.jar包之外,还需要commons-logging.jar包,大家直接从lib文件夹下面copy进去就OK了

分享到:
评论

相关推荐

    JAVA上百实例源码以及开源项目源代码

     Tcp服务端与客户端的JAVA实例源代码,一个简单的Java TCP服务器端程序,别外还有一个客户端的程序,两者互相配合可以开发出超多的网络程序,这是最基础的部分。 递归遍历矩阵 1个目标文件,简单! 多人聊天室 3...

    HttpClient以及获取页面内容应用

    18. 源代码基于Apache License 可免费获取。 1.3版本 org.apache.http.impl.client.HttpClients 与 org.apache.commons.httpclient.HttpClient目前后者已被废弃,apache已不再支持。 一般而言,使用HttpClient均需...

    简单的HTTP功能监控功能(java httpclient-3.1)

    NULL 博文链接:https://xugunlin-126-com.iteye.com/blog/385418

    JAVA上百实例源码以及开源项目

     Tcp服务端与客户端的JAVA实例源代码,一个简单的Java TCP服务器端程序,别外还有一个客户端的程序,两者互相配合可以开发出超多的网络程序,这是最基础的部分。 递归遍历矩阵 1个目标文件,简单! 多人聊天室 3...

    java网页抓取demo

    包含jar包commons-logging,httpclient-4.1.2.jar,httpcore-4.2.1.jar main类文件,文档,源码

    httpClient 4.1.3 获取css中图片

    httpClient 4.1.3 获取css中图片 java源代码 分享给各位 想下载css中的图片 还可以用来学习httpClient 里面含有httpClient4的jar包,还用了swing的好看的主题。

    jsoup httpclient 爬取网页并下载google图标

    NULL 博文链接:https://you-java.iteye.com/blog/1460271

    HttpClient模拟登陆源码 pjYzm.zip

    工程里的入口类为:mnLogin.java ,由于模拟登陆的网站,使用了自签名的SSL证书,所以新增两个方法,创建HttpClient不校验服务端证书,后台通过调用登陆接口,获得返回的cookie信息,在使用登陆成功...从而获取获取。

    java jdk实列宝典 光盘源代码

    获取类的信息,ViewClassInfoJrame.java; 动态调用类的方法,CallMetod.java; 13、网络编程 获取URL信息,主要是使用URLConnection类,GetUrlInfo.java; web浏览器,webbrowser.java; 获取IP地址和域名,...

    JAVA获取邮件联系人

    方法2:利用httpclient模拟登录邮箱,抓取联系人页面的源代码---------使用http监听工具,抓出 邮箱登录、跳转(action)、联系人页面 等URL、form表单中隐藏的参数、高版本httpclient会自动管理cookie

    java获取天气预报

    java获取实时天气状况。介绍了两种方法:1.通过httpclient请求中央气象台API接口获取xml数据 2.分析中央气象台页面源码,通过htmlunit技术从html中抓取实时天气信息

    JAVA发送HttpClient请求及接收请求完整代码实例

    NULL 博文链接:https://bijian1013.iteye.com/blog/2310211

    百度贴吧签到网站源码Java-playfish:playfish基于JAVA技术的网页内容智能抓取

    百度贴吧签到网站源码Java playfish playfish 基于JAVA技术的网页内容智能抓取 基于JAVA技术的网页内容智能抓取 架构 完全基于java的技术 核心技术 XML解析,HTML解析,开源组件应用。应用的开源组件包括:  DOM4J...

    java开源包8

    JOpenID是一个轻量级的OpenID 2.0 Java客户端,仅50KB+(含源代码),允许任何Web网站通过OpenID支持用户直接登录而无需注册,例如Google Account或Yahoo Account。 JActor的文件持久化组件 JFile JFile 是 JActor ...

    搜索链接Java网络爬虫(蜘蛛)源码-zhizhu

    网页抓取:使用Java的网络编程库(如HttpURLConnection、Apache HttpClient等)来发送HTTP请求,获取网页的HTML内容。 网页解析:利用Java的HTML解析库(如Jsoup、HtmlCleaner等)来解析网页的HTML结构,提取出所需...

    Java网络蜘蛛(爬c)源码.zip

    Java的网络爬虫是一种用于从互联网上获取信息的程序,通常用于抓取网页内容、收集数据或执行其他自动化任务。网络爬虫是搜索引擎、数据挖掘和信息收集等领域的重要工具。 Java的网络爬虫通常基于Java的网络编程库,...

    java开源包10

    JOpenID是一个轻量级的OpenID 2.0 Java客户端,仅50KB+(含源代码),允许任何Web网站通过OpenID支持用户直接登录而无需注册,例如Google Account或Yahoo Account。 JActor的文件持久化组件 JFile JFile 是 JActor ...

    java开源包4

    JOpenID是一个轻量级的OpenID 2.0 Java客户端,仅50KB+(含源代码),允许任何Web网站通过OpenID支持用户直接登录而无需注册,例如Google Account或Yahoo Account。 JActor的文件持久化组件 JFile JFile 是 JActor ...

    java开源包101

    JOpenID是一个轻量级的OpenID 2.0 Java客户端,仅50KB+(含源代码),允许任何Web网站通过OpenID支持用户直接登录而无需注册,例如Google Account或Yahoo Account。 JActor的文件持久化组件 JFile JFile 是 JActor ...

Global site tag (gtag.js) - Google Analytics