國際書展
  • 電子書
Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術 (電子書)
主題活動 試閱
收藏試閱本 137
人收藏
適合平板

Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術 (電子書)

  • 定價:620特價:460
  • 特價再85折:391
  • 優惠期限:2025年04月09日止
載入中...

電子書閱讀軟體

支援瀏覽器說明

APP下載:

  • 分享
 

內容簡介

☀ 科技來自於人性,讓程式設計回歸生活上的應用!
☀ 本書不只讓你學會Python,還要讓它「真正」進入你的日常生活!
 
  人工智慧世代必備的資料擷取術 ─ 網路爬蟲,幫你建立 Python 網路爬蟲 SOP 標準作業程序
 
  ☛  資料是王 ( Data is King ),誰擁有資料,誰就能主宰世界。從 Python 網路爬蟲到生活應用,完整說明你需要必備的 Python 資料擷取術。
 
  ☛  網路爬蟲就是從 HTML 網頁取得資料。你可以想像在 Web 星球 ( WWW ) 上有眾多果園 ( 網站 ) 和 HTML 果樹 ( 網頁 ),你的工作是拿著水果籃進入指定的果園後,爬上果樹摘下樹上的水果 ( HTML 標籤 ),你需要定位水果在哪裡以及規劃摘取順序,才能成功摘下整棵樹的水果,放進水果籃。
 
  ☛  本書讓你學得到 Python,用得到 Python,還能夠「真正活用」Python 來解決你日常生活、學習和工作上,各種資料擷取和處理的問題。
 
  適用讀者
  ✎  已經有其他程式語言基礎、或對運算思維有興趣的初學者。
  ✎  適合讀者自學 Python 程式設計,亦可作為 Python 程式設計相關課程的上課教材。
 
  本書提供線上資源下載
  ☛  fChart
 

作者介紹

作者簡介
 
陳會安
 
  現 職
  專職資訊圖書作者、大專資訊課程老師
 
  經 歷
  企業講師、松崗電腦產品經理、美商PH出版經理、專業電腦書作者。
 
  資訊技術作家,出版超過 100 本電腦著作, 包括: 程式設計( C / C + + 、J a v a 、C # 、( H T M L 5 、P H P 、ASP.NET、JSP等)、資料庫、系統分析、資料結構等各種不同主題。
 
  近年研究人工智慧、機器學習 / 深度學習、資料科學、網路爬蟲、大數據分析和物聯網相關課程與圖書寫作,也熱衷利用 Raspberry Pi 、 Arduino 、ESP8266 / ESP32 和 Micro:bit 等開發板製作創客作品,投入創客領域的教學與寫作。
 
  fChart 程式設計教學工具官方網址:
  fChart
 

目錄

01 Python 程式設計入門
1-1 Python 變數、資料型別與運算子
1-2 流程控制
1-3 函式、模組與套件
1-4 容器型別
1-5 類別與物件
1-6 檔案處理
 
02 爬取的資料來源:HTML、CSV 和 JSON
2-1 HTML 與 CSS 基礎
2-2 資料標籤 – 文字和圖片標籤
2-3 群組標籤 – 清單、表格和結構標籤
2-4 網站巡覽 – 超連結標籤
2-5 互動介面 – 表單標籤
2-6 CSV 與 JSON
 
03 作業步驟一:認識網路爬蟲與 HTML 網頁分析
3-1 網路爬蟲與 URL 網址
3-2 認識 JavaScript 動態網頁內容
3-3 建立 Python 網路爬蟲的 SOP
3-4 使用開發人員工具分析 HTML 網頁結構
3-5 生活應用:分析 BBC News 新聞清單的標籤結構
 
04 作業步驟二:Requests 和 Selenium 取得網路資料
4-1 使用 requests 取得網路資料
4-2 使用 Selenium 取得網路資料
4-3 取得 HTML 表單送回的網路資料
4-4 使用 Web API 取得網路資料
4-5 生活應用:取得無限捲動分頁的網路資料
4-6 生活應用:剖析摩根台股指數的 JSON 資料
 
05 作業步驟三:BeautifulSoup 剖析和擷取網頁資料
5-1 使用 BeautifulSoup 擷取網頁資料
5-2 使用正規表達式擷取網頁資料
5-3 Selenium+BeautifulSoup 擷取網頁資料
5-4 如何破解網站的防爬機制
5-5 生活應用:爬取 BBC News 新聞清單
5-6 生活應用:Selenium 自動登入 Facebook
 
06 作業步驟四:Pandas 資料清理、讀取與儲存
6-1 Pandas 基本使用
6-2 Pandas 資料讀取與儲存
6-3 Pandas 常用的資料處理
6-4 Pandas 資料清理
6-5 生活應用:使用 Pandas 繪製視覺化圖表
 
07 應用實務:爬取食衣住行和娛樂資訊
7-1 擷取單一網頁的單一資料
7-2 擷取單一網頁的單筆記錄
7-3 擷取單一網頁的多筆記錄
7-4 擷取多頁網頁的多筆記錄
7-5 生活應用:爬取台鐵列車時刻 / 車次查詢資料
 
08 應用實務:爬取排行榜和網路趨勢資訊
8-1 爬取網站的排行榜資訊
8-2 認識 Google Trends 網路趨勢
8-3 pytrends 套件爬取 Google Trends 網路趨勢
8-4 生活應用:視覺化分析新冠肺炎的網路趨勢
 
09 整合應用:IFTTT、LINE 和 Telegram 發送通知訊息
9-1 註冊與使用 IFTTT 服務
9-2 申請與使用 LINE Notify
9-3 設定與使用 Telegram Bot 機器人
9-4 整合應用:IFTTT 和 LINE/Telegram 發送即時天氣訊息
 
10 應用實務:爬取 YouTube 等影音網站
10-1 爬取 YouTube 影片搜尋頁面
10-2 使用 pytube3 套件下載 YouTube 影片
10-3 下載 YouTube 聲音檔與字幕
10-4 生活應用:批次下載 YouTube 播放清單的影片
10-5 生活應用:爬取無限捲動分頁 YouTube 影片資料
10-6 生活應用:使用 You-Get 下載影音網站的影片
 
11 應用實務:爬取 Imgur 和 PTT 表特版圖片
11-1 爬取與下載網頁圖片
11-2 爬取 Imgur 網路相簿網站
11-3 爬取 PTT BBS 文章和表特版圖片
11-4 生活應用:使用 Python 批次下載爬取圖片
11-5 生活應用:爬取和下載 Instagram 圖片
 
12 整合應用:自動排程通知、爬取 / 下載資料和 Telegram Bot
12-1 使用 APScheduler 套件建立自動排程
12-2 建立 Telegram Bot 機器人
12-3 整合應用:自動排程送出通知訊息
12-4 整合應用:自動排程下載多媒體資料
12-5 整合應用:Telegram Bot 管家機器人
 
13 應用實務:爬取金融與商務資料
13-1 爬取即時匯率和匯率的歷史資料
13-2 使用 twder 套件爬取新台幣匯率
13-3 爬取上市櫃公司的金融數據
13-4 生活應用:爬取台灣證交所的券商資料
13-5 生活應用:使用上市公司月營收選出好股票
 
14 應用實務:爬取股市指數和股價數據
14-1 爬取股價指數和股價資料
14-2 使用 twstock 套件爬取台股股價
14-3 爬取 yahoo! finance 股價資料
14-4 爬取台股三大法人買賣超日報表
14-5 生活應用:繪製台積電股價的移動平均線
14-6 生活應用:使用 twstock 套件分析股票買賣點
 
15 整合應用:SQLite 資料庫和 Plotly 繪製互動圖表
15-1 SQLite 資料庫的基本使用
15-2 使用 Plotly 套件繪製網頁互動圖表
15-3 整合應用:將爬取的股票資料存入資料庫
15-4 整合應用:Plotly 繪製台積電股票的 OHLC 圖表
16 整合應用:Web API 和 LINE/Telegram Bot 聊天機器人
 
16-1 Flask 的基本使用
16-2 使用 Ngrok 取得外部 URL 網址
16-3 整合應用:Flask 建立 Web API
16-4 整合應用:Flask 建立 LINE Bot 聊天機器人
16-5 整合應用:Flask 建立 Telegram Bot 聊天機器人
 
A 安裝與使用Python 開發環境 - Anaconda 和 WinPython
(電子書,所有本書內文所提到的附錄A,請上博碩官網下載)
A-1 Anaconda 整合散發套件
A-2 WinPython 整合散發套件
A-3 Spyder 整合開發環境的使用
A-4 Python IDLE 整合開發環境的使用
A-5 使用pip 安裝 Python 套件
 

詳細資料

  • ISBN:9789864345397
  • 規格:普通級 / 初版
  • 出版地:台灣
  • 檔案格式:EPUB固定版型
  • 建議閱讀裝置:平板
  • TTS語音朗讀功能:無
  • 檔案大小:358.9MB

會員評鑑

4.5
1人評分
|
1則書評
|
立即評分
user-img
Lv.2
4.5
|
2021/08/24

再學會一些基本的python操作之後,如果對爬蟲有興趣,非常建議的一本書,各個方面都帶你實作,跟著寫成就感也會增高,內部範例述說的也很詳細。
展開

最近瀏覽

 

相關活動

  • 【自然科普、電腦資訊】遠流暢銷電子書展|單本79折、兩本75折
 

購物說明

使用電子書服務即為同意『博客來數位內容服務條款』請詳見客服中心說明。

自備暢通的網際網路連線及符合博客來支援的行動裝置、電腦作為閱讀工具,支援版本如下:

瀏覽器閱讀:無需安裝,即可閱讀。支援Safari (14以上版本)、Chrome (103以上版本) 、Edge瀏覽器 (106以上版本)。

APP閱讀:支援IOS13及Android 7以上系統。

電子書、 電子雜誌因版本屬性因素,恕無法比照紙本書籍提供MP3、DVD實體光碟,亦無提供相關影音檔案下載,請先確認無此需求再行下單購買。

請注意:

博客來電子書服務所使用之軟體程式及其支援行動裝置之可用版本隨時會更新調整,請隨時留意且主動查詢調整之內容。並請定時更新您的行動裝置作業系統版本,以確保本服務運作正常。若因個人裝置因素(如:其他應用程式衝突、裝置記憶體不足、行動裝置支援版本無法升級),無法使用博客來電子書閱讀服務或影響服務效能,需自行進行排除待符合博客來支援項目再行閱讀。

退換貨說明:

電子書購買前請務必先行試閱,不提供10天的猶豫期。

下列商品購買後博客來不提供10天的猶豫期,請務必詳閱商品說明並再次確認確有購買該項商品之需求及意願時始下單購買,有任何疑問並請先聯繫博客來客服詢問:

1.易於腐敗、保存期限較短或解約時即將逾期。
2.客製化之商品。
3.報紙、期刊或雜誌。
4.經消費者拆封之影音商品或電腦軟體。
5.下載版軟體、資訊及電子書、有聲書及影音.課程
6.涉及個人衛生,並經消費者拆封之商品,如:內衣褲、刮鬍刀…等。
7.藝文展覽票券、藝文表演票券。

  • 史上最強技術分析 量價關係
  • 超高齡社會的消費行為學
  • 牙齒治療與植牙圖解百科