跳去內容

程式語言理論

出自維基百科,自由嘅百科全書
唔同程式嘅語言:低級程式語言(上)、C 程式語言(中)同埋 Python 程式語言(下)

程式語言理論粵拼cing4 sik1 jyu5 jin4 lei5 leon6 | 英文PLT)係電腦科學嘅一個子領域,包含研究程式語言呢樣嘢應該點樣設計、分析同埋分門別類嘅一套理論[1]

程式語言係為咗俾用家可以俾命令電腦而設嘅人工語言,為嘅係想要令電腦易用啲:原則上,電腦淨係識得睇完全由一串串 1 同 0 組成機械碼(machine code),而呢啲一大串嘅 1 同 0 對一般人嚟講相當難明[2];電腦嘅設計者就創造出好似組合語言(asm)同高級程式語言等嘅程式語言​​用呢啲語言寫成嘅源碼喺俾部電腦攞去行之前會轉化成機械碼,不過呢啲語言往往俾人設計成易睇過機械語言,令程式編寫呢家嘢易做啲。而隨住電腦科技嘅發展,廿一世紀初嘅電腦界出咗好多隻唔同嘅程式語言,每款程式語言都有獨特嘅功能[1][3]

程式語言理論做嘅就係嘗試比較唔同嘅程式語言:程式語言理論會用邏輯形式化(formalized)​​即係每個符號都有清晰定義,唔似得自然語言咁多歧義​嘅語言嚟表達唔同嘅程式語言,剖析唔同程式語言彼此之間喺解難能力上有乜嘢差異,例如係「某隻程式語言會唔會比起第啲語言更加擅長解某啲類型嘅問題」等嘅課題[4]。呢啲理論思考會同數學軟件工程語言學認知科學等嘅領域互相影響,而且對電腦應用​​例如係新程式語言嘅設計噉​​嚟講相當緊要[5]

背景

[編輯]

程式語言(programming language)係一類特殊嘅語言[註 1],用嚟教機械運算同埋表達啲演算法(algorithm)嘅語義:响廿一世紀初,電子電腦靠嘅係用內部嗰啲​​閒閒地數以十億計嘅​邏輯門(logic gate)嚟操控微弱電流做運算;而用家需要有某啲方法控制呢啲運算​​發明程式語言嘅目的就正正係想令「教機械做運算」呢家嘢自動化,令到電腦變得更加易用[6][7]

語言等級

[編輯]

機械語言(machine lanaguage)係最似電腦內部嘅實際運算嗰種程式語言,即係最低級(low-level)[註 2]嘅程式語言​​淨係用 1(有電過)同 0(冇電過)嘅二進制數字嚟表達嗮所有嘢,而組成一段機械碼嘅數字會包含嗮「要用啲乜嘢數據」同「要做啲乜嘢作業」等嘅資訊[2]

舉個例說明:假想依家有款機械語言,

  • 款語言嘅每段命令都由 18 個數字組成,呢 18 個數字每一個都一係 1 一係 0(每一個呢啲數字成一個 bit),
    • 最頭嗰 7 個數字用二進制表達數據 A
    • 跟住嗰 7 個數字用二進制表達數據 B
    • 最尾嗰 4 個數字就表達要做乜(呢段就係所謂嘅行動碼;opcode)​​0000 代表,0001 代表等等。

於是喺用呢種語言寫成嘅源碼入面,「0000011 0000100 0000」呢段碼係叫電腦計 3(用二進制寫係 11)加 4(用二進制寫係 100)嘅結果出嚟[2][8]

一般認為,機械語言有個重大缺點,就係可讀性(readability)低得好交關:就算係專業做資訊科技嘅人都普遍覺得機械語言好難睇,吓吓都係一大柞 1 同 0,而且當中多咗個 0 或者少噉咗個 0 就搞到成段碼都軭嗮;因為噉,人喺廿世紀中開始就有喺度創造多種嘅高級(high-level)程式語言,即係用形式化(簡單講就係高度精確)得嚟又易睇嘅方式,表達用家想電腦做嘅運算,出名嘅例子有 C 同相關嘅語言、Python 同埋 Java 呀噉​​呢啲語言同低級程式語言一樣咁精確,會好似數學符號噉個個字都有固定嘅意思,但同時又會用自然語言嘅字(例如 if)或者一般人都識嘅常見數學符號(例如 x = a + b 噉嘅碼叫部電腦做加數),令到用呢啲語言寫出嚟嘅碼一般人都會睇得明。程式語言理論就係呢股趨勢嘅結果​電腦科學方面嘅工作者用數學邏輯學語言學嘅方法比較唔同嘅程式語言之間有乜異同,仲有係諗程式語言應該點設計、分析同分類[1]

句法同語義

[編輯]

句法(syntax)同語義(semantics)係程式語言理論上兩個緊密相關嘅基礎概念,喺分析程式語言嗰陣成日都會提到。一隻程式語言嘅句法係指一柞規則,負責定義「响呢隻語言當中,邊啲符號組合算係結構上正確嘅陳述式」,定義嘅係一隻程式語言嘅「表面形式」;句法對應嘅係語義,語義係指一串電腦運算作業背後嘅邏輯或者數學結構;語義好多時係隻隻語言都完全一樣咁滯,不過唔同嘅程式語言往往會有唔同嘅句法,將同一款語義以唔同嘅樣表達出嚟;舉個例說明,想像以下呢串簡單嘅運算作業[9]

  • 語義(背後嘅邏輯結構):
    • 日常用語:「如果 a 呢個變數嘅數值大過 0a > 0),噉就做作業 taskA[註 3]」;
    • 邏輯上嘅符號:a > 0 taskA
  • 唔同程式語言嘅句法(用乜符號嚟表達呢串語義)會唔同:
CC++C♯: Python: MATLAB: Lisp: PostScript:
if (a > 0) { 
      taskA;
}
if a > 0: 
      taskA
if (a > 0)
      taskA;
end
(if (> a 0)
    (taskA))
a 0 gt {
      taskA
} if

理論上,如果有個人設計一隻新嘅程式語言,佢大可以將隻語言設計成用「-」(句法)嚟表達「」呢個算術作業(語義)​​不過,因為啲人多數習慣咗用 - 嚟表達「」,噉樣做會搞到啲人好唔慣,變相令隻語言冇咁好用[9]

「砌」算子

[編輯]
睇埋:公理

喺思考點樣設計程式語言嗰陣,有一點係好重要嘅:一隻程式語言實會有若干款嘅算子(operator;指一隻程式語言入面行為似函數噉嘅嘢,例如「加減」或者「比較兩個數嘅大細」呀噉);比較複雜嘅算子通常都有得由簡單啲​​或者「基礎」啲​​嘅算子嗰度「砌」出嚟;舉個簡單例子,想像家陣一隻程式語言要有陳述式嚟做「比較兩個數值」嘅運算​​需要用到 =等如)、>(大過)、<(細過)、>=(大過或者等如)... 等等嘅算子,查實呢啲算子冚唪唥都可以齋靠 < 就砌到嗮出嚟[10]

  • 假設家陣款語言乜都冇,但經已
    1. 能夠理解到乜嘢係 <(細過;lessThan)同 not邏輯非),
    2. 識得做 if... then... 噉嘅條件決策,同埋
    3. 處理到布林(真定假)嘅輸入輸出
  • >=(大過或者等如)可以定義做:
     public static boolean greaterThanOrEqualTo(int a, int b) {
       return not(lessThan(a, b));
     }
    
    如果 a < b,噉 lessThan(a, b) 會出 1(真),而 return not(lessThan(a, b)) 會跟住令呢個子程序會出 0,而噉就定義到 >=​因為a < b 就表示「a >= b」係假。
  • =(等如)就可以噉樣定義:
     public static boolean equalTo(int a, int b) {
       if (greaterThanOrEqualTo(a, b))
         return greaterThanOrEqualTo(b, a);
       else
         return false;
     }
    
    如果 b = agreaterThanOrEqualTo(a, b)(上面定義咗)會出 1(真),而跟住 greaterThanOrEqualTo(b, a) 又會出 1,於是 return greaterThanOrEqualTo(b, a) 就會令個子程序會出 1,如果 greaterThanOrEqualTo(a, b) 或者 greaterThanOrEqualTo(b, a) 是但一個出 0(假),噉成個子程序就會出 0

... 如此類推。

Λ 演算

[編輯]
内文:Λ 演算

Λ 演算(lambda calculus)係一種用嚟將可運算函數表達出嚟嘅語言。Λ 演算具有圖靈完整性(Turing completeness),即係任何能夠計嗮 Λ 演算表示到嘅運算嘅運算機械能夠計到任何圖靈機計得到嘅嘢[11],所以程式語言理論好興攞 Λ 演算嚟做共同語言​​即係用 Λ 演算表示程式語言嘅語義[12]

Λ 演算嘅起始點係函數(function):Λ 演算將一個函數想像成一個「黑盒」,會攞若干個輸入,跟住俾出某啲輸出,而輸入同輸出之間會成某啲特定嘅關係,例:f(x) = x + 1 當中嘅 可以想像成「攞 呢個數值做輸入,計 ,再俾後者出嚟做輸出」,複雜啲嘅函數可以用同一道理想像。Λ 演算會將每一段運算(程式語言想表達嘅語義)表達成一段段好似以下噉嘅「句子」​​每句嘢最左手邊都有個「」符號,表示句嘢係 Λ 演算, 跟住後面嘅係個輸入(程式參數),而輸入後面隔一點嘅係輸出,當中個輸出要以「同輸入成乜關係」嘅形式寫出嚟[13][14]

​輸入:;輸出:
​輸入:;輸出:
​輸入:;輸出:
嘅定義係「」;輸入:;輸出:
  • 定義自然數

... 等等。進一步嘅 Λ 演算仲有得砌埋條件運算式等嘅嘢出嚟[15]

環境

[編輯]

變數

[編輯]

控制流程

[編輯]
内文:控制流程

編程範式

[編輯]

函數編程

[編輯]
内文:函數編程

邏輯編程

[編輯]
内文:邏輯編程

指令式編程

[編輯]

物件導向編程

[編輯]

註釋

[編輯]
  1. 用行話講,電腦科學上嘅「語言」可以用有限狀態機(FSM)嘅概念嚟諗:依然想像一部有若干個狀態嘅 FSM,部機係接受機,即係得一部份嘅可能狀態係接受狀態;部 FSM 每讀到一個符號嗰陣狀態會變,有啲符號串造成嘅最終狀態係接受狀態,又有啲符號唔會去到接受狀態,一隻「語言」可以想像成一柞「去到接受狀態嘅符號串」嘅
  2. 「低級」係指抽象化嘅程度低,所以隻語言會反映部電腦內部嘅運算嘅實況。
  3. 姑且唔好諗「taskA」係乜嘢住。

睇埋

[編輯]

文獻

[編輯]
  • Abadi, Martín and Cardelli, Luca. A Theory of Objects. Springer-Verlag.

[編輯]
  1. 1.0 1.1 1.2 Gordon, M. J. (1988). Programming language theory and its implementation (Vol. 10). Englewood Cliffs, NJ: Prentice-Hall.
  2. 2.0 2.1 2.2 Tech Target - machine code (machine language).
  3. Gunter, Carl and Mitchell, John C. (eds.). Theoretical Aspects of Object Oriented Programming Languages: Types, Semantics, and Language Design. MIT Press.
  4. Prechelt, L. (2000). An empirical comparison of seven programming languages (PDF). Computer, 33(10), 23-29.
  5. White, G. L., & Sivitanides, M. P. (2002). A theory of the relationships between cognitive requirements of computer programming languages and programmers' cognitive characteristics (PDF). Journal of information systems education, 13(1), 59.
  6. Uchiyama, S., Kawai, N., de Silva, A. P., & Iwai, K. (2004). Fluorescent polymeric AND logic gate with temperature and pH as inputs. Journal of the American Chemical Society, 126(10), 3032-3033.
  7. Deschamps, J. P., Valderrama, E., & Terés, L. (2016). Digital systems: From logic gates to processors. Springer.
  8. Hennessy, John L.; Patterson, David A. Computer Organization and Design. The Hardware/Software Interface. Morgan Kaufmann Publishers.
  9. 9.0 9.1 Friedman, Daniel P.; Mitchell Wand; Christopher T. Haynes (1992). Essentials of Programming Languages (1st ed.). The MIT Press.
  10. Iverson, K. E. (1962, May). A programming language (PDF). In Proceedings of the May 1-3, 1962, spring joint computer conference (pp. 345-351).
  11. Turing, Alan M. (December 1937). "Computability and λ-Definability". The Journal of Symbolic Logic. 2 (4): 153–163.
  12. Barendregt, H. (1997). The impact of the lambda calculus in logic and computer science. Bulletin of Symbolic Logic, 181-215.
  13. Hankin, C. (2004). An introduction to lambda calculi for computer scientists. King's College.
  14. Lambda Calculus (Part I).
  15. Understanding conditional expressions with λ calculus. Medium.

[編輯]