電商網(wǎng)站 廈門哪個平臺可以隨便發(fā)廣告
數(shù)據(jù)真是越來越多啊
正文開始
一、數(shù)據(jù)
結(jié)構(gòu)化數(shù)據(jù)
????????可以使用關(guān)系型數(shù)據(jù)庫表示和存儲的數(shù)據(jù),擁有固定結(jié)構(gòu)
半結(jié)構(gòu)化數(shù)據(jù)
????????弱結(jié)構(gòu)化,雖然不符合關(guān)系型數(shù)據(jù)模型的要求,但是含有相關(guān)的標(biāo)記(自描述結(jié)構(gòu)),分割實體及其屬性 。如:XML,JSON等
非結(jié)構(gòu)化數(shù)據(jù)
????????沒有固定數(shù)據(jù)結(jié)構(gòu),或很難發(fā)現(xiàn)統(tǒng)一數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)
????????文檔,文本,圖片,視頻,音頻等
二、數(shù)據(jù)庫
數(shù)據(jù)庫(Database, DB)
????????長期儲存在計算機內(nèi)、有組織的、可共享的大量數(shù)據(jù)的集合。
數(shù)據(jù)庫管理系統(tǒng)(Database Management System, DBMS)
????????位于用戶與操作系統(tǒng)之間的一層數(shù)據(jù)管理軟件
數(shù)據(jù)庫系統(tǒng)(Database System,簡稱DBS)
????????在計算機系統(tǒng)中引入數(shù)據(jù)庫后的系統(tǒng)構(gòu)成
????????DB、DBMS(及其開發(fā)工具)、應(yīng)用系統(tǒng)、數(shù)據(jù)庫管理員
關(guān)系型數(shù)據(jù)庫系統(tǒng)(SQL)
????????關(guān)系模型中數(shù)據(jù)的邏輯結(jié)構(gòu)是一張二維表,行與列
????????特點:結(jié)構(gòu)化
????????概念:關(guān)系,屬性,元組
????????優(yōu)點1:管理效率高(十萬,百萬,千萬… )
數(shù)據(jù)庫的安全性:自主存取控制與強制存取控制
自主存取控制(Discretionary Access Control ,簡稱DAC)
????????用戶可“自主”地決定將數(shù)據(jù)的存取權(quán)限授予何人、決定是否也將“授予”的權(quán)限授予別人
強制存取控制(Mandatory Access Control,簡稱 MAC)
????????系統(tǒng)“強制”地給用戶和數(shù)據(jù)標(biāo)記安全等級
????????(1)僅當(dāng)主體(如用戶)的許可證級別大于或等于客體(數(shù)據(jù),表,索引等)的密級時,該主體才能讀取相應(yīng)的客體
????????(2)僅當(dāng)主體的許可證級別小于或等于客體(數(shù)據(jù))的密級時,該主體才能寫相應(yīng)的客體
數(shù)據(jù)庫的效率:索引
????????建立索引(Index)的目的:加快查詢速度
????????誰可以建立索引
????????????????DBA 或 表的屬主(即建立表的人)
????????????????DBMS一般會自動建立以下列上的索引
????????????????????????PRIMARY KEY
????????????????????????UNIQUE
????????誰維護索引
????????????????DBMS自動完成
使用索引
????????DBMS自動選擇是否使用索引以及使用哪些索引
RDBMS中索引一般采用B+樹、HASH索引來實現(xiàn)
????????B+/B-樹索引具有動態(tài)平衡的優(yōu)點
????????HASH索引具有查找速度快的特點
NoSQL(Not Only SQL)
????????非關(guān)系型的DBMS,不同于傳統(tǒng)關(guān)系型DB的DBMS的統(tǒng)稱
????????超大規(guī)模數(shù)據(jù)存儲,不需要固定模式,無需多余操作橫向擴展
為什么NoSQL?(大數(shù)據(jù))
????????數(shù)據(jù)量的飛速增長:GB-TB-PB
????????RDBMS的范式約束、事務(wù)特性、磁盤IO等特點的限制
????????開發(fā)需求的前期不明確
如果要詳細學(xué)習(xí)NoSQL:可以學(xué)習(xí)MongoDB
MongoDB VS MySQL
NoSQL適用于
????????數(shù)據(jù)模型比較簡單;
????????需要靈活性更強的IT系統(tǒng);
????????對DBMS性能要求較高;
????????不需要高度的數(shù)據(jù)一致性;
????????對于給定key,比較容易映射復(fù)雜值的環(huán)境
附:想要查看各個數(shù)據(jù)庫的使用排名,可以去看如下鏈接
https://db-engines.com/en/rankinghttps://db-engines.com/en/ranking
三、爬蟲及數(shù)據(jù)庫學(xué)習(xí)分享鏈接
Beautiful Soup
Beautiful Soup 4.4.0 文檔 — beautifulsoup 4.4.0q 文檔http://beautifulsoup.readthedocs.io/zh_CN/latest/
MongoDB教程
MongoDB 教程 | 菜鳥教程MongoDB 教程 MongoDB是一個流行的開源文檔型數(shù)據(jù)庫,它使用類似 JSON 的文檔模型存儲數(shù)據(jù),這使得數(shù)據(jù)存儲變得非常靈活。 MongoDB 是一個基于文檔的 NoSQL 數(shù)據(jù)庫,由 MongoDB Inc. 開發(fā)。 MongoDB 旨在為 WEB 應(yīng)用提供可擴展的高性能數(shù)據(jù)存儲解決方案。 MongoDB 是一個介于關(guān)系數(shù)據(jù)庫和非關(guān)系數(shù)據(jù)庫之間的產(chǎn)品,是非關(guān)系數(shù)據(jù)庫當(dāng)中功能最豐富,最像關(guān)系數(shù)據(jù)庫的。 現(xiàn)在開始學(xué)習(xí) ..http://www.runoob.com/mongodb/mongodb-tutorial.html
CSS選擇器教程
CSS 選擇器參考手冊http://www.w3school.com.cn/cssref/css_selectors.asp
jsoup教程
http://blog.csdn.net/column/details/jsoup.htmlhttp://blog.csdn.net/column/details/jsoup.html
scrapy教程
Scrapy入門教程 — Scrapy 0.24.6 文檔http://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/tutorial.html
下一講,我們將講述數(shù)據(jù)預(yù)處理