正妹牆
我們是誰?
組員:3 個人
Peter
- 臺東大學不務正業學士(pre)
- 海大血汗碩士(now)
- PHP developer
- Web developer
- Github:https://github.com/peter279k
品瑄
- 聚會,有事
- JavaScript 初心者
- jQuery 初學者
哲瑋
- JavaScript 初心者
- jQuery 初學者
- 國軍 Online 中~
表特粉絲專頁?
survey
表特大學
表特輔大
事情是這樣的...
同學說:有好看的圖片在 Facebook 上喔
我也忍不住好奇的去看
裡面真的有好多圖片...
不過...
真的太多了,怎麼拉也拉不完 ORZ
我產生了一個想法
為什不把內容爬下來呢?
爬粉絲專頁
- 申請一個 Facebook APP access token
- 使用 Facebook graph api
- 抓取圖片,架設網站供人瀏覽
- 文章內容省略,原因少有名字(個資法),多半是情緒文字
- 找還存活的粉絲專頁
Facebook graph api
- 粉絲專頁
- https://graph.facebook.com/{page-id}/feed?access_token={you-app-token}
- Since the Graph API version 2.5, you need to specify the fileds.
- Available field lists
- full_picture
- created_time
- message
- likes
- object_id
- https://graph.facebook.com/167874227121383/feed?fields=full_picture,created_time,message,likes,object_id&access_token={your-access-token}
- Available field lists
Facebook graph api ( cont. )
{
"data": [
{
"id": "1450930895146846_1650532745186659",
"from": {
"name": "\u8868\u7279\u6771\u5927",
"category": "Community",
"id": "1450930895146846"
},
"message": "\u5404\u4f4d\u8868\u7279\u7d1b\u7d72\u5011\uff0c\u6700\u8fd1\u5929\u6c23\u8b8a\u6dbc\u56c9\n\u5916\u51fa\u8a18\u5f97\u591a\u52a0\u5e7e\u4ef6\u8863\u670d\u54e6\n#\u8eb2\u5728\u88ab\u7aa9\u88e1\u767c\u6296\u7684\u5c0f\u7de8\n\u3010\u6b63\u59b9\u3011\n#200\u8868\u7279\u6771\u5927\n#\u6b63\u59b9\u8868\u7279\u6771\u5927\n\n\u5fc3\u52d5\u7cfb \u9ec3\u5fae\u7b51\n\u6703\u904b\u52d5\u53c8\u611b\u641e\u602a\u7684\u967d\u5149\u5973\u5b69\n\u6709\u6a5f\u6703\u8ddf\u4f60\u4f86\u5834\u6bd4\u8cfd\u55ce~?\n\nhttp://goo.gl/jkC5Cu",
"story": "\u8868\u7279\u6771\u5927 added a new photo.",
"story_tags": {
"0": [
{
"id": "1450930895146846",
"name": "\u8868\u7279\u6771\u5927",
"type": "page",
"offset": 0,
"length": 4
}
]
},
....
Facebook graph api ( cont. )
-
https://graph.facebook.com/{object_id}/picture?type={image-size}
- {image-size}
- thumbnail
- album
- normal ( default )
做完之後...
感覺還少了什麼?
只有圖片呈現
缺少實用的資訊
因此...
表特大學
- 以學校為單位,統計上榜學校人數
- 運用 open data 大專院校清單
- 畫出統計圖
表特輔大
- 以校系為單位,統計上榜校系人數
- 運用輔大網站,統計出各校系資料
- 畫出統計圖
困難點
- 字串處理,過濾雜訊資料
- 校系名稱有簡寫與不一致
- 校名有簡寫,名稱不同
- 非臺灣的學校
- 小編的情緒字眼(?
- 錯字 ORZ ...
技術面
架構
前端
後端
- PHP 5.5
- Using Composer
- Using packagist → 找套件的好地方
- router
- flexpress/component-controller
- simple dispatchModel → 自幹
Demo
分析結果
表特大學
表特輔仁
Future
- 增加訂閱,發信給訂閱者,接收最新訊息
- PHP cli 類別架構化(目前 procedural 架構)
Q & A
正妹牆
By peter279k
正妹牆
- 2,156