正妹牆

我們是誰?

組員:3 個人

Peter

品瑄

  • 聚會,有事
  • JavaScript 初心者
  • jQuery 初學者

哲瑋

  • JavaScript 初心者
  • jQuery 初學者
  • 國軍 Online 中~

表特粉絲專頁?

survey

表特大學

表特輔大

事情是這樣的...

同學說:有好看的圖片在 Facebook 上喔

我也忍不住好奇的去看

裡面真的有好多圖片...

不過...

真的太多了,怎麼拉也拉不完 ORZ

我產生了一個想法

為什不把內容爬下來呢?

爬粉絲專頁

  • 申請一個 Facebook APP access token
  • 使用 Facebook graph api
  • 抓取圖片,架設網站供人瀏覽
  • 文章內容省略,原因少有名字(個資法),多半是情緒文字
  • 找還存活的粉絲專頁

Facebook graph api

  • 粉絲專頁
  • https://graph.facebook.com/{page-id}/feed?access_token={you-app-token}
  • Since the Graph API version 2.5, you need to specify the fileds.
    • Available field lists
      • full_picture
      • created_time
      • message
      • likes
      • object_id
    • https://graph.facebook.com/167874227121383/feed?fields=full_picture,created_time,message,likes,object_id&access_token={your-access-token}

Facebook graph api ( cont. )



{
   "data": [
      {
         "id": "1450930895146846_1650532745186659",
         "from": {
            "name": "\u8868\u7279\u6771\u5927",
            "category": "Community",
            "id": "1450930895146846"
         },
         "message": "\u5404\u4f4d\u8868\u7279\u7d1b\u7d72\u5011\uff0c\u6700\u8fd1\u5929\u6c23\u8b8a\u6dbc\u56c9\n\u5916\u51fa\u8a18\u5f97\u591a\u52a0\u5e7e\u4ef6\u8863\u670d\u54e6\n#\u8eb2\u5728\u88ab\u7aa9\u88e1\u767c\u6296\u7684\u5c0f\u7de8\n\u3010\u6b63\u59b9\u3011\n#200\u8868\u7279\u6771\u5927\n#\u6b63\u59b9\u8868\u7279\u6771\u5927\n\n\u5fc3\u52d5\u7cfb \u9ec3\u5fae\u7b51\n\u6703\u904b\u52d5\u53c8\u611b\u641e\u602a\u7684\u967d\u5149\u5973\u5b69\n\u6709\u6a5f\u6703\u8ddf\u4f60\u4f86\u5834\u6bd4\u8cfd\u55ce~?\n\nhttp://goo.gl/jkC5Cu",
         "story": "\u8868\u7279\u6771\u5927 added a new photo.",
         "story_tags": {
            "0": [
               {
                  "id": "1450930895146846",
                  "name": "\u8868\u7279\u6771\u5927",
                  "type": "page",
                  "offset": 0,
                  "length": 4
               }
            ]
         },
....

Facebook graph api ( cont. )

  • https://graph.facebook.com/{object_id}/picture?type={image-size}

  • {image-size}
  • thumbnail
  • album
  • normal ( default )

做完之後...

感覺還少了什麼?

只有圖片呈現

缺少實用的資訊

因此...

表特大學

  • 以學校為單位,統計上榜學校人數
  • 運用 open data 大專院校清單
  • 畫出統計圖

表特輔大

  • 以校系為單位,統計上榜校系人數
  • 運用輔大網站,統計出各校系資料
  • 畫出統計圖

困難點

  • 字串處理,過濾雜訊資料
  • 校系名稱有簡寫與不一致
  • 校名有簡寫,名稱不同
  • 非臺灣的學校
  • 小編的情緒字眼(?
  • 錯字 ORZ ...

技術面

架構

前端

後端

Demo

分析結果

表特大學

表特輔仁

Future

  • 增加訂閱,發信給訂閱者,接收最新訊息
  • PHP cli 類別架構化(目前 procedural 架構)

Q & A