Remove ads
研究信息和計算的理論基礎 来自维基百科,自由的百科全书
計算機科學(英語:Computer science,有時縮寫為CS)是系統性研究資訊與計算的理論基礎以及它們在電腦系統中如何實現與應用的實用技術的學科。[7] [8]它通常被形容為對那些創造、描述以及轉換資訊的演算法處理的系統研究。計算機科學包含很多分支領域;有些強調特定結果的計算,比如電腦圖學;而有些是探討計算問題的性質,比如計算複雜性理論;還有一些領域專注於怎樣實現計算,比如程式語言理論是研究描述計算的方法,而程式設計是應用特定的程式語言解決特定的計算問題,人機互動則是專注於怎樣使電腦和計算變得有用、好用,以及隨時隨地為人所用。
有時公眾會誤以為計算機科學就是解決電腦問題的事業(比如資訊科技),或者只是與使用電腦的經驗有關,如玩遊戲、上網或者文書處理。其實計算機科學所關注的,不僅僅是去理解實現類似遊戲、瀏覽器這些軟件的程式的性質,更要通過現有的知識創造新的程式或者改進已有的程式。[9]
儘管計算機科學(computer science)的名字裏包含計算機這幾個字,但實際上計算機科學相當數量的領域都不涉及電腦本身的研究。因此,一些新的名字被提議出來。某些重點大學的院系傾向於術語計算科學(computing science),以精確強調兩者之間的不同。丹麥科學家彼得·諾爾建議使用術語"datalogy",以反映這一事實,即科學學科是圍繞着數據和數據處理,而不一定要涉及電腦。第一個使用這個術語的科學機構是哥本哈根大學計算科學系,該學院成立於1969年,彼得·諾爾便是第一任教授。這個術語主要被用於北歐國家。同時,在計算技術發展初期,《ACM通訊》建議了一些針對計算領域從業人員的術語:圖靈工程師(turingineer),turologist,流程圖人(flow-charts-man),應用元數學家(applied meta-mathematician)及應用認識論者(applied epistemologist)。[10] 三個月後在同樣的期刊上,comptologist被提出,第二年又變成了hypologist。[11] 術語computics也曾經被提議過。在歐洲大陸,起源於資訊(information)和數學或者自動(automatic)的名字比起源於電腦或者計算(computation)更常見,如informatique(法語),Informatik(德語),informatika(斯拉夫語族)。
著名計算機科學家艾茲赫爾·戴克斯特拉曾經指出:「計算機科學並不只是關於電腦,就像天文學並不只是關於望遠鏡一樣。」("Computer science is no more about computers than astronomy is about telescopes.")設計、部署電腦和電腦系統通常被認為是非計算機科學學科的領域。例如,研究電腦硬件被看作是電腦工程的一部分,而對於商業電腦系統的研究和部署被稱為資訊科技或者資訊系統。然而,現如今也越來越多地融合了各類電腦相關學科的思想。計算機科學研究也經常與其它學科交叉,比如數學、工程學、認知科學和經濟學等。
計算機科學被認為比其它科學學科與數學的聯絡更加密切,一些觀察者說計算就是一門數學科學。[12] 早期計算機科學受數學研究成果的影響很大,如庫爾特·哥德爾、艾倫·圖靈、路莎·彼得,阿隆佐·邱奇等數學家的研究,這兩個領域在某些學科,例如數理邏輯、範疇論、域理論和代數,也不斷有有益的思想交流。
早期計算機科學建立的基礎得追溯到最近電腦的發明。那些計算固定數值任務的機器,比如算盤,自古希臘時期即已存在,而用於加快計算的演算法更是在算盤等古老的計算儀器發明之前就已被廣泛使用。
Wilhelm Schickard在1623年設計了世界上第一台機械計數機,但沒有完成它的建造。[13]布萊茲·帕斯卡在1642年設計並且建造了世界上第一台可以工作的機械計數機Pascaline。1673年,萊布尼茲開始了步進計數機的建造工作並於1694年竣工,他也因為記錄了二進制系統而被認為是第一個計算機科學家和資訊理論家。埃達·洛夫萊斯協助查爾斯·巴貝奇在維多利亞時代設計了差分機[14][15]。1900年左右,打孔機問世[16]。然而以上這些機器都局限在只能完成單個任務,或者充其量是所有可能任務的子集。
到了20世紀40年代,隨着更新更強大的電腦器(如ABC電腦、電子數值積分電腦)被發明,術語「電腦」開始用於指代那些機器而不是它們的祖先。[17]電腦的概念變得更加清晰,它不僅僅用於數學運算,總的來說計算機科學的領域也擴充到了對於計算的研究。20世紀50年代至20世紀60年代早期,計算機科學開始被確立為不同種類的學術學科。[18] 世界上第一個計算機科學學位點由普渡大學在1962年設立。[19]隨着實用電腦的出現,很多計算的應用都以它們自己的方式逐漸轉變成了研究的不同領域。
雖然最初很多人並不相信電腦可能成為科學研究的領域,但是隨後的50年裏也逐漸被學術界認可。[20]IBM公司是那段時期計算機科學革命的參與者之一。在那段探索時期,IBM(International Business Machines的縮寫)發佈的IBM 704以及之後的IBM 709電腦被廣泛使用。「不過,使用IBM電腦工作仍然是一件很沮喪的事情。如果你弄錯了一條指令中的一個字母,程式將會崩潰,而你也得從頭再來。」[20]20世紀50年代後期,計算機科學學科還在發展階段,這種問題在當時是一件很常見的事情。
隨着時間的推移,計算機科學技術在可用性和有效性上都有顯著提升。現代社會見證了電腦從僅僅由專業人士使用到被廣大用戶接受的重大轉變。最初,電腦非常昂貴,要有效利用它們,某種程度上必須得由專業的電腦操作員來完成。然而,隨着電腦變得普及和低廉,已經幾乎不需要專人的協助,雖然某些時候援助依舊存在。
雖然計算機科學被認定為一門正規學科的歷史很短暫,但它對科學和社會做出了許多根本性的貢獻ー事實上,計算機科學與電子學一樣,是資訊年代的奠基科學,也是資訊革命的驅動力,被視為繼工業革命(公元1750-1850年)和新石器革命(公元前8000-5000年)之後人類技術進步的第三次重大飛躍。
這些貢獻包括:
Peter Wegner提出計算機科學可以分成三個領域:數學、工程學、科學。Amnon H. Eden提議了三種範式應用於計算機科學的各個領域:[31]
作為一個學科,計算機科學涵蓋了從演算法的理論研究和計算的極限,到如何通過硬件和軟件實現計算系統。[32][33] CSAB(以前被叫做Computing Sciences Accreditation Board),由Association for Computing Machinery(ACM)和IEEE電腦協會(IEEE-CS)的代表組成[34],確立了計算機科學學科的4個主要領域:計算理論,演算法與數據結構,編程方法與程式語言,以及電腦組成與架構。CSAB還確立了其它一些重要領域,如軟件工程,人工智能,電腦網絡與通訊,資料庫系統,平行計算,分散式計算,人機互動,電腦圖學,作業系統,以及數值和符號計算。
廣義的理論計算機科學包括經典的計算理論和其它專注於更抽象、邏輯與數學方面的計算。
演算法分析 | 演算法 | 數據結構 | 計算幾何 | 圖學 |
演算法指定義良好的計算過程,它取一個或一組值作為輸入,經過一系列定義好的計算過程,得到一個或一組輸出。[35]演算法是計算機科學研究的一個重要領域,也是許多其他計算機科學技術的基礎。演算法主要包括數據結構、計算幾何、圖學等。除此之外,演算法還包括許多雜項,如模式匹配、部分數論等。
按照Peter J. Denning的說法,計算機科學的最根本問題是「什麼能夠被有效地自動化?」[12]計算理論的研究就是專注於回答這個根本問題,關於什麼能夠被計算,去實施這些計算又需要用到多少資源。為了試圖回答第一個問題,遞歸論檢驗在多種理論計算模型中哪個計算問題是可解的。而計算複雜性理論則被用於回答第二個問題,研究解決一個不同目的的計算問題的時間與空間消耗。
著名的「P=NP?」問題,千禧年大獎難題之一,[36]是計算理論的一個開放問題。
P = NP ? | GNITIRW-TERCES | |||
自動機理論 | 遞歸論 | 計算複雜性理論 | 密碼學 | 量子計算論 |
此章節需要擴充。 (2013年1月) |
資訊論與資訊量化相關,由克勞德·香農建立,用於尋找訊號處理操作的根本極限,比如壓縮數據和可靠的數據儲存與通訊。編碼理論是對編碼以及它們適用的特定應用性質的研究。編碼(code)被用於數據壓縮,密碼學,正向錯誤校正,近期也被用於網絡編碼。研究編碼的目的在於設計更高效、可靠的數據傳輸方法。
程式語言理論是計算機科學的一個分支,主要處理程式語言的設計、實現、分析、描述和分類,以及它們的個體特性。它屬於計算機科學學科,既受影響於也影響着數學、軟件工程和語言學。它是公認的計算機科學分支,同時也是活躍的研究領域,研究成果被發表在眾多學術期刊,計算機科學以及工程出版物。
類型論 | 編譯器設計 | 程式語言 |
形式化方法是一種特別的基於數學的技術,用於軟件和硬件系統的形式規範、開發以及驗證。在軟件和硬件設計方面,形式化方法的使用動機,如同其它工程學科,是通過適當的數學分析便有助於設計的可靠性和健壯性的期望。但是,使用形式化方法會帶來很高的成本,意味着它們通常只用於高可靠性系統,這種系統中安全或保安(security)是最重要的。對於形式化方法的最佳形容是各種理論計算機科學基礎種類的應用,特別是電腦邏輯演算,形式語言,自動機理論和形式語意學,此外還有型別系統、代數資料類型,以及軟件和硬件規範和驗證中的一些問題。
電腦系統結構,或者數字電腦組織,是一個電腦系統的概念設計和根本運作結構。它主要側重於CPU的內部執行和主記憶體訪問地址。這個領域經常涉及電腦工程和電子工程學科,選擇和互連硬件組件以創造滿足功能、效能和成本目標的電腦。
數字電路 | 微架構 | 多處理機 |
作業系統是管理電腦硬件與軟件資源的電腦程式,同時也是電腦系統的核心與基石。作業系統需要處理如管理與組態記憶體、決定系統資源供需的優先次序、控制輸入與輸出裝置、操作網路與管理檔案系統等基本事務。作業系統也提供一個讓用戶與各電腦裝置互動的操作介面。
並行性(concurrency)是系統的一種性質,這類系統可以同時執行多個可能互相互動的計算。一些數學模型,如Petri網、行程演算和PRAM模型,被建立以用於通用並行計算。分散式系統將並行性的思想擴充到了多台由網絡連接的電腦。同一分散式系統中的電腦擁有自己的私有主記憶體,它們之間經常交換資訊以達到一個共同的目的。
電腦網絡是管理遍及全球的電腦連接成的網絡的計算機科學分支。
電腦安全是電腦技術的一個分支,其目標包括保護資訊免受未經授權的訪問、中斷和修改,同時為系統的預期用戶保持系統的可訪問性和可用性。密碼學是對於隱藏(加密)和破譯(解密)資訊的實踐與研究。現代密碼學主要跟計算機科學相關,很多加密和解密演算法都是基於它們的計算複雜性。
資料庫是為了更容易地組織、儲存和檢索大量數據。資料庫由資料庫管理系統管理,通過數據模型和查詢語言來儲存、建立、維護和搜尋數據。
此章節需要擴充。 (2013年1月) |
電腦圖學是對於數字視覺內容的研究,涉及圖像數據的合成和操作。它跟計算機科學的許多其它領域密切相關,包括電腦視覺、圖像處理、計算幾何與視覺化,同時也被大量運用在特效和電子遊戲。
科學計算(或者計算科學)是關注構建數學模型和量化分析技術的研究領域,同時通過電腦分析和解決科學問題。在實際使用中,它通常是電腦模擬和計算等形式在各個科學學科問題中的應用。
數值分析 | 計算物理學 | 計算化學 | 生物資訊科學 |
多媒體技術是指通過電腦對文字、數據、圖形、圖像、動畫、聲音等多種媒體資訊進行綜合處理和管理,使用戶可以通過多種感官與電腦進行即時資訊互動的技術,又稱為電腦多媒體技術。
這個計算機科學分支旨在創造可以解決計算問題,以及像動物和人類一樣思考與交流的人造系統。無論是在理論還是應用上,都要求研究者在多個學科領域具備細緻的、綜合的專長,比如應用數學,邏輯,符號學,電機工程學,精神哲學,神經生理學和社會智力,用於推動智慧研究領域,或者被應用到其它需要計算理解與建模的學科領域,如金融或是物理科學。人工智能領域開始變得正式源於Alan Turing這位人工智能先驅提出了圖靈試驗,以回答這樣一個終極問題:「電腦能夠思考嗎?」[37]
機器學習 | 電腦視覺 | 圖像處理 |
圖型識別 | 數據探勘 | 演化計算 |
知識表示和自動推理 | 自然語言處理 | 機械人學 |
軟件工程是對於設計、實現和修改軟件的研究,以確保軟件的高質素、適中的價格、可維護性,以及能夠快速構建。它是一個系統的軟件設計方法,涉及工程實踐到軟件的應用。
計算機科學和軟件工程的關聯是一個有爭議的話題,隨後關於什麼是「軟件工程」,計算機科學又該如何定義的爭論使得情況更加混亂。David Parnas從其它工程和科學學科之間的關聯得到啟示,宣稱計算機科學的主要重點總的來說是研究計算的性質,而軟件工程的主要重點是具體的計算設計,以達到實用的目的,這樣便構成了兩個獨立但又互補的學科。[38]
此章節需要擴充。 (2013年1月) |
SIGIR(Special Interest Group on Information Retrieval)
KDD(Knowledge Discovery and Data Mining)
AAAI(the Association for the Advance of Artificial Intelligence)
ACL(Annual Meeting of the Association for Computational Linguistics)
NAACL(The North American Chapter of the Association for Computational Linguistics) 其為ACL的北美分會
EMNLP(Conference on Empirical Methods in Natural Language Processing)
IJCAI( International Joint Conference on Artificial Intelligence)
此章節需要擴充。 (2013年1月) |
一些教授計算機科學的大學[哪個/哪些?]主要進行計算和演算法推理的研究。其中包括計算理論、演算法分析、形式化方法、並列理論、資料庫、電腦圖學以及系統分析等。通常也教授程式設計,但僅僅將它看作是支援計算機科學其它領域的媒介,而不是進階研究的重心。
其它一些學院、大學、中學以及職業培訓[哪個/哪些?]的計算機科學課程則主要側重於訓練進階編程,而不是演算法和計算理論。這些課程着重教授那些對於軟件工業很重要的技能。像這樣的電腦編程過程通常被叫做軟件工程。
然而,儘管計算機科學專業日益推動着美國經濟,但是計算機科學教育依然不存在大多數美國K-12課程中。2010年10月由ACM(頁面存檔備份,存於互聯網檔案館)和計算機科學教師協會(CSTA)(頁面存檔備份,存於互聯網檔案館)共同發表了一篇名為「Running on Empty: The Failure to Teach K-12 Computer Science in the Digital Age」的報告,文中揭示了僅有14個州通過了有意義的高中計算機科學教育標準。同時,僅有9個州將高中計算機科學課程算作畢業要求的核心學科。配合「Running on Empty」這篇文章,一個新的無黨派宣傳聯盟:Computing in the Core(CinC)被建立,以影響聯邦和政府政策,比如Computer Science Education Act(頁面存檔備份,存於互聯網檔案館)要求政府撥款以制定計劃完善計算機科學教育及支援計算機科學教師。
在中國,「計算機科學」或「計算機科學與技術」是工科(一級門類)下的二級專業。一般可細分為三級專業:
此章節需要擴充。 (2013年1月) |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.