之前分享过网红城市成都,得到了一些朋友的肯定,让我再写下其他城市。刚好这两天又获取到了两份关于长沙的数据:长沙景点和长沙美食,之后进行了分析,如果有朋友想去长沙或者周边城市玩,要仔细看看喔。 长沙景点的数据获取方法和之前的的文章是一样的,只是重新跑了一遍代码,如果有没有看过之前文章的朋友再给大家展示一下代码过程,具体源代码如下: <?php // 要访问的目标页面 $url = "https://www.ctrip.com/"; $urls = "https://www.ctrip.com/"; // 代理服务器(产品官网 www.16yun.cn) define("PROXY_SERVER", "tcp://t.16yun.cn:31111"); // 代理身份信息 define("PROXY_USER", "16LILLRU"); define("PROXY_PASS", "175535"); $proxyAuth = base64_encode(PROXY_USER . ":" . PROXY_PASS); // 设置 Proxy tunnel $tunnel = rand(1,10000); $headers = implode("\r\n", [ "Proxy-Authorization: Basic {$proxyAuth}", "Proxy-Tunnel: ${tunnel}", ]); $sniServer = parse_url($urls, PHP_URL_HOST); $options = [ "http" => [ "proxy" => PROXY_SERVER, "header" => $headers, "method" => "GET", 'request_fulluri' => true, ], 'ssl' => array( 'SNI_enabled' => true, // Disable SNI for https over http proxies 'SNI_server_name' => $sniServer ) ]; print($url); $context = stream_context_create($options); $result = file_get_contents($url, false, $context); var_dump($result); // 访问 HTTPS 页面 print($urls); $context = stream_context_create($options); $result = file_get_contents($urls, false, $context); var_dump($result);?>curlGuzzleHttp最终数据有1000多条,数据中绝大部分是长沙的景点数据,也有少量少量周边城市,比如:宁乡、浏阳等的数据。然后景点中很显然:橘子洲、岳麓山、岳麓书院、太平老街排名靠前。 有些游客到一个地方喜欢写评论,还有特色美食分享,我也一起获取了些进行分析。 通过多方面的数据获取和分析,数据量虽然不大,但还是想到长沙旅游的朋友几点建议:1、橘子洲你应该去看看2、五一广场真的很热门3、不怕辣就吃龙虾4、一定要尝下湖南米粉,5、长沙的臭豆腐是一定要再尝尝的。
|