3C科技 娛樂遊戲 美食旅遊 時尚美妝 親子育兒 生活休閒 金融理財 健康運動 寰宇綜合

Zi 字媒體

2017-07-25T20:27:27+00:00
加入好友
信息安全公益宣傳,信息安全知識啟蒙。網上已經有很多拿PostgreSQL與MySQL比較的文章了,這篇文章只是對一些重要的信息進行下梳理。在開始分析前,先來看下這兩張圖:MySQLMySQL聲稱自己是最流行的開源資料庫。LAMP中的M指的就是MySQL。構建在LAMP上的應用都會使用MySQL,如WordPress、Drupal等大多數php開源程序。MySQL最初是由MySQL AB開發的,然後在2008年以10億美金的價格賣給了Sun公司,Sun公司又在2010年被Oracle收購。Oracle支持MySQL的多個版本:Standard、Enterprise、Classic、Cluster、Embedded與Community。其中有一些是免費下載的,另外一些則是收費的。其核心代碼基於GPL許可,由於MySQL被控制在Oracle,社區擔心會對MySQL的開源會有影響,所以開發了一些分支,比如: MariaDB和Percona。PostgreSQLPostgreSQL標榜自己是世界上最先進的開源資料庫。PostgreSQL的一些冬粉說它能與Oracle相媲美,而且沒有那麼昂貴的價格和傲慢的客服。最初是1985年在加利福尼亞大學伯克利分校開發的,作為Ingres資料庫的後繼。PostgreSQL是完全由社區驅動的開源項目。它提供了單個完整功能的版本,而不像MySQL那樣提供了多個不同的社區版、商業版與企業版。PostgreSQL基於自由的BSD/MIT許可,組織可以使用、複製、修改和重新分發代碼,只需要提供一個版權聲明即可。MySQL與PostgreSQL的對比MySQL的背後是一個成熟的商業公司,而PostgreSQL的背後是一個龐大的志願開發組。這使得MySQL的開發過程更為慎重,而PostgreSQL的反應更為迅速。這樣的兩種背景直接導致了各自固有的優點和缺點。PostgreSQL相對於MySQL的優勢1)不僅僅是關係型資料庫除了存儲正常的數據類型外,還支持存儲:json和jsonb之間的區別jsonb和json在更高的層面上看起來幾乎是一樣的,但在存儲實現上是不同的。json存儲完的文本,json列會每次都解析存儲的值,它不支持索引,但你可以為查詢創建表達式索引。jsonb存儲的二進位格式,避免了重新解析數據結構。它支持索引,這意味著你可以不使用指定的索引就能查詢任何路徑。當我們比較寫入數據速度時,由於數據存儲的方式的原因,jsonb會比json稍微的慢一點。json列會每次都解析存儲的值,這意味著鍵的順序要和輸入的時候一樣。但jsonb不同,以二進位格式存儲且不保證鍵的順序。因此,如果你有軟體需要依賴鍵的順序,jsonb可能不是你的應用的最佳選擇。使用jsonb的優勢還在於你可以輕易的整合關係型數據和非關係型數據, PostgreSQL對於mongodb這類的基於文檔的資料庫是個不小的威脅,畢竟如果一個表中只有一列數據的類型是半結構化的,沒有必要為了遷就它而整個表的設計採用schemaless的結構。2)支持地理信息處理擴展PostGIS 為PostgreSQL提供了存儲空間地理數據的支持,使PostgreSQL成為了一個空間資料庫,能夠進行空間數據管理、數量測量與幾何拓撲分析。在功能上,和MYSQL對比,PostGIS具有下列優勢:O2O業務場景中的LBS業務使用PostgreSQL + PostGIS有無法比擬的優勢。3)可以快速構建REST APIPostgREST 可以方便的為任何 PostgreSQL 資料庫提供完全的 RESTful API 服務。4)支持樹狀結構支持R-trees這樣可擴展的索引類型,可以更方便地處理一些特殊數據。MySQL 處理樹狀的設計會很複雜, 而且需要寫很多代碼, 而 PostgreSQL 可以高效處理樹結構。5)有極其強悍的 SQL 編程能力支持遞歸,有非常豐富的統計函數和統計語法支持。MySQL:支持 CREATE PROCEDURE 和 CREATE FUNCTION 語句。存儲過程可以用 SQL 和 C++ 編寫。用戶定義函數可以用 SQL、C 和 C++ 編寫。PostgreSQL:沒有單獨的存儲過程,都是通過函數實現的。用戶定義函數可以用 PL/pgSQL(專用的過程語言)、PL/Tcl、PL/Perl、PL/Python 、SQL 和 C 編寫。6)外部數據源支持可以把 70 種外部數據源 (包括 Mysql, Oracle, CSV, hadoop …) 當成自己資料庫中的表來查詢。Postgres有一個針對這一難題的解決方案:一個名為「外部數據封裝器(Foreign Data Wrapper,FDW)」的特性。該特性最初由PostgreSQL社區領袖Dave Page四年前根據SQL標準SQL/MED(SQL Management of External Data)開發。FDW提供了一個SQL介面,用於訪問遠程數據存儲中的遠程大數據對象,使DBA可以整合來自不相關數據源的數據,將它們存入Postgres資料庫中的一個公共模型。這樣,DBA就可以訪問和操作其它系統管理的數據,就像在本地Postgres表中一樣。例如,使用FDW for MongoDB,資料庫管理員可以查詢來自文檔資料庫的數據,並使用SQL將它與來自本地Postgres表的數據相關聯。藉助這種方法,用戶可以將數據作為行、列或JSON文檔進行查看、排序和分組。他們甚至可以直接從Postgres向源文檔資料庫寫入(插入、更細或刪除)數據,就像一個一體的無縫部署。也可以對Hadoop集群或MySQL部署做同樣的事。FDW使Postgres可以充當企業的中央聯合資料庫或「Hub」。7)沒有字元串長度限制一般關係型資料庫的字元串有限定長度8k左右,無限長 TEXT 類型的功能受限,只能作為外部大數據訪問。而PostgreSQL的 TEXT 類型可以直接訪問,SQL語法內置正則表達式,可以索引,還可以全文檢索,或使用xml xpath。MySQL 的各種text欄位有不同的限制,要手動區分 small text, middle text, large text… PostgreSQL 沒有這個限制,text 能支持各種大小。8)支持圖結構數據存儲沒有具體使用過,具體可以自己搜索下。參考鏈接:https://mp.weixin.qq.com/s/cjor82wgDu5gzDvTYpLDWw9)支持窗口函數窗口函數提供跨行相關的當前查詢行集執行計算的能力。僅當調用跟著OVER子句的聚集函數,作為窗口函數;否則它們作為常規的聚合函數。窗口也是一種分組,但和 group by 的分組不同。窗口,可以提供分組之外,還可以執行對每個窗口進行計算。可以相像成是group by 后,然後對每個分組進行計算,而不像Group by ,只是單純地分組。MySQL 不支持 OVER 子句, 而PostgreSQL支持。OVER 子句能簡單的解決 「每組取 top 5」 的這類問題。MySQL支持的SQL語法(ANSI SQL標準)的很小一部分。不支持遞歸查詢、通用表表達式(Oracle的with 語句)或者窗口函數(分析函數)。10)對索引的支持更強PostgreSQL 的可以使用函數和條件索引,這使得PostgreSQL資料庫的調優非常靈活,mysql就沒有這個功能,條件索引在web應用中很重要。對於索引類型:MySQL:取決於存儲引擎。MyISAM:BTREE,InnoDB:BTREE。PostgreSQL:支持 B-樹、哈希、R-樹和 Gist 索引。InnoDB的表和索引都是按相同的方式存儲。也就是說表都是索引組織表。這一般要求主鍵不能太長而且插入時的主鍵最好是按順序遞增,否則對性能有很大影響。PostgreSQL不存在這個問題。索引類型方面,MySQL取決於存儲引擎。MyISAM:BTREE,InnoDB:BTREE。PostgreSQL支持 B-樹、哈希、R-樹和 Gist 索引。11)集群支持更好Mysql Cluster可能與你的想象有較大差異。開源的cluster軟體較少。複製(Replication)功能是非同步的並且有很大的局限性。例如,它是單線程的(single-threaded),因此一個處理能力更強的Slave的恢復速度也很難跟上處理能力相對較慢的Master。PostgreSQL有豐富的開源cluster軟體支持。plproxy 可以支持語句級的鏡像或分片,slony 可以進行欄位級的同步設置,standby 可以構建WAL文件級或流式的讀寫分離集群,同步頻率和集群策略調整方便,操作非常簡單。另外,PostgreSQL的主備複製屬於物理複製,相對於MySQL基於binlog的邏輯複製,數據的一致性更加可靠,複製性能更高,對主機性能的影響也更小。對於WEB應用來說,複製的特性很重要,mysql到現在也是非同步複製,pgsql可以做到同步,非同步,半同步複製。還有mysql的同步是基於binlog複製,類似oracle golden gate,是基於stream的複製,做到同步很困難,這種方式更加適合異地複製,pgsql的複製基於wal,可以做到同步複製。同時,pgsql還提供stream複製。12)事務隔離做的更好MySQL 的事務隔離級別 repeatable read 並不能阻止常見的併發更新, 得加鎖才可以, 但悲觀鎖會影響性能, 手動實現樂觀鎖又複雜. 而 PostgreSQL 的列里有隱藏的樂觀鎖 version 欄位, 默認的 repeatable read 級別就能保證併發更新的正確性, 並且又有樂觀鎖的性能。13)對於字元支持更好一些MySQL 里需要 utf8mb4 才能顯示 emoji 的坑, PostgreSQL 沒這個坑。14)對錶連接支持較完整對錶連接支持較完整,MySQL只有一種表連接類型:嵌套循環連接(nested-loop),不支持排序-合併連接(sort-merge join)與散列連接(hash join)。PostgreSQL都支持。15)存儲方式支持更大的數據量PostgreSQL主表採用堆表存放,MySQL採用索引組織表,能夠支持比MySQL更大的數據量。16)時間精度更高MySQL對於時間、日期、間隔等時間類型沒有秒以下級別的存儲類型,而PostgreSQL可以精確到秒以下。17)優化器的功能較完整MySQL對複雜查詢的處理較弱,查詢優化器不夠成熟,explain看執行計劃的結果簡單。性能優化工具與度量信息不足。PostgreSQL很強大的查詢優化器,支持很複雜的查詢處理。explain返回豐富的信息。提供了一些性能視圖,可以方便的看到發生在一個表和索引上的select、delete、update、insert統計信息,也可以看到cache命中率。網上有一個開源的pgstatspack工具。18)序列支持更好MySQL 不支持多個表從同一個序列中取 id, 而 PostgreSQL 可以。19)對子查詢支持更好對子查詢的支持。雖然在很多情況下在SQL語句中使用子查詢效率低下,而且絕大多數情況下可以使用帶條件的多表連接來替代子查詢,但是子查詢的存在在很多時候仍然不可避免。而且使用子查詢的SQL語句與使用帶條件的多表連接相比具有更高的程序可讀性。幾乎任何資料庫的子查詢 (subquery) 性能都比 MySQL 好。20)增加列更加簡單MySQL表增加列,基本上是重建表和索引,會花很長時間。PostgreSQL表增加列,只是在數據字典中增加表定義,不會重建表.MySQL相對於PostgreSQL的優勢1)MySQL比PostgreSQL更流行流行對於一個商業軟體來說,也是一個很重要的指標,流行意味著更多的用戶,意味著經受了更多的考驗,意味著更好的商業支持、意味著更多、更完善的文檔資料。易用,很容易安裝。第三方工具,包括可視化工具,讓用戶能夠很容易入門。2)回滾實現更優innodb的基於回滾段實現的MVCC機制,相對PG新老數據一起存放的基於XID的MVCC機制,是佔優的。新老數據一起存放,需要定時觸發VACUUM,會帶來多餘的IO和資料庫對象加鎖開銷,引起資料庫整體的併發能力下降。而且VACUUM清理不及時,還可能會引發數據膨脹。3)在Windows上運行更可靠與PostgreSQL相比,MySQL更適宜在Windows環境下運行。MySQL作為一個本地的Windows應用程序運行(在 NT/Win2000/WinXP下,是一個服務),而PostgreSQL是運行在Cygwin模擬環境下。PostgreSQL在Windows下運行沒有MySQL穩定,應該是可以想象的。4)線程模式相比進程模式的優勢MySQL使用了線程,而PostgreSQL使用的是進程。在不同線程之間的環境轉換和訪問公用的存儲區域顯然要比在不同的進程之間要快得多。進程模式對多CPU利用率比較高。進程模式共享數據需要用到共享內存,而線程模式數據本身就是在進程空間內都是共享的,不同線程訪問只需要控制好線程之間的同步。線程模式對資源消耗比較少。所以MySQL能支持遠比PostgreSQL多的更多的連接。但PostgreSQL中有優秀的連接池軟體軟體,如pgbouncer和pgpool,所以通過連接池也可以支持很多的連接。5)許可權設置上更加完善MySQL在許可權系統上比PostgreSQL某些方面更為完善。PostgreSQL只支持對於每一個用戶在一個資料庫上或一個數據表上的 INSERT、SELECT和UPDATE/DELETE的授權,而MySQL允許你定義一整套的不同的數據級、表級和列級的許可權。對於列級的許可權, PostgreSQL可以通過建立視圖,並確定視圖的許可權來彌補。MySQL還允許你指定基於主機的許可權,這對於目前的PostgreSQL是無法實現的,但是在很多時候,這是有用的。6)存儲引擎插件化機制MySQL的存儲引擎插件化機制,使得它的應用場景更加廣泛,比如除了innodb適合事務處理場景外,myisam適合靜態數據的查詢場景。7)適應24/7運行MySQL可以適應24/7運行。在絕大多數情況下,你不需要為MySQL運行任何清除程序。PostgreSQL目前仍不完全適應24/7運行,這是因為你必須每隔一段時間運行一次VACUUM。8)更加試用於簡單的場景PostgreSQL只支持堆表,不支持索引組織表,Innodb只支持索引組織表。索引組織表的優勢:表內的數據就是按索引的方式組織,數據是有序的,如果數據都是按主鍵來訪問,那麼訪問數據比較快。而堆表,按主鍵訪問數據時,是需要先按主鍵索引找到數據的物理位置。索引組織表的劣勢:索引組織表中上再加其它的索引時,其它的索引記錄的數據位置不再是物理位置,而是主鍵值,所以對於索引組織表來說,主鍵的值不能太大,否則佔用的空間比較大。對於索引組織表來說,如果每次在中間插入數據,可能會導致索引分裂,索引分裂會大大降低插入的性能。所以對於使用innodb來說,我們一般最好讓主鍵是一個無意義的序列,這樣插入每次都發生在最後,以避免這個問題。由於索引組織表是按一個索引樹,一般它訪問數據塊必須按數據塊之間的關係進行訪問,而不是按物理塊的訪問數據的,所以當做全表掃描時要比堆錶慢很多,這可能在OLTP中不明顯,但在數據倉庫的應用中可能是一個問題。總結MySQL從一開始就沒有打算做所有事情,因而它在功能方面有一定的局限性,並不能滿足一些先進應用程序的要求。MySQL對某些功能(例如引用、事務、審計等)的實現方式使得它與其他的關係型資料庫相比缺少了一些可靠性。對於簡單繁重的讀取操作,使用PostgreSQL可能有點小題大做,同時性能也比MySQL這樣的同類產品要差。除非你需要絕對的數據完整性,ACID遵從性或者設計複雜,否則PostgreSQL對於簡單的場景而言有點多餘。如何你確定只在MySQL和PostgreSQL中進行選擇,以下規則總是有效的:如果你的操作系統是Windows,你應該使用MySQL。當絕對需要可靠性和數據完整性的時候,PostgreSQL是更好的選擇。如果需要資料庫執行定製程序,那麼可擴展的PostgreSQL是更好的選擇。你的應用處理的是地理數據,由於R-TREES的存在,你應該使用PostgreSQL。如果你對資料庫並不了十分了解,甚至不知道事務、存儲過程等究竟是什麼,你應該使用MySQL。▼ 閱讀原文,查看更多精彩文章。

本文由yidianzixun提供 原文連結

寫了 5860316篇文章,獲得 23313次喜歡
精彩推薦