Từ điển học hệ thống: Một số thành tựu Ngôn ngữ học Nga và Xô Viết

01/07/2013

                                                            GS.TS Lý Toàn Thắng

 

1. Dẫn nhập

Ở Việt Nam chuyên ngành Từ điển học (tiếng Nga: Leksikografija, tiếng Anh: Lexicography) không hẳn là còn “non trẻ”, có thể tính “tuổi” cho nó chừng 40 năm - kể từ khi xuất hiện những trình bày (bằng miệng) và các nghiên cứu khoa học (được công bố) đầu tiên mang tính chuyên đề về Từ điển học của cố GS Hoàng Phê (và một số cộng sự của ông) tại Viện Ngôn ngữ học vào những năm 1966-1969 của thế kỉ XX .

Trên cơ sở những thành công của công tác biên soạn Từ điển tiếng Việt những năm 1975-1995, đặc biệt với sự ra đời của cuốn Từ điển tiếng Việt năm 1988, đã có rất nhiều bài viết về lí luận Từ điển học, đề cập đến các khía cạnh khác nhau của công việc biên soạn từ điển như: cách xây dựng bảng từ, lời định nghĩa, cách đưa thí dụ, cách chú giải về từ loại, về phong cách, về từ ngữ đia phương,… Đáng chú ý là cuốn Một số vấn đề Từ điển học (xuất bản năm1997, tác giả là các cán bộ thuộc Viện Ngôn ngữ học) có thể được coi là một “dấu mốc”, một “bước ngoặt” của lí thuyết về Từ điển học ở Việt Nam.

Tuy nhiên, những nghiên cứu về Từ điển học ở Việt Nam thường có mục đích rất thực tiễn là hướng đến giải quyết những vấn đề cụ thể trong công tác biến soạn từ điển và chủ yếu là được các nhà biên soạn từ điển tổng kết lại từ kinh nghiệm thực tế làm từ điển của bản thân mình. Điều này, một mặt, tuy rất thiết thực và hữu ích, nhưng mặt khác không khỏi có phần bị hạn chế bởi khả năng hữu hạn - do những khó khăn về thời gian và sách vở tham khảo ở Việt Nam - trong việc nhìn rộng ra những lí thuyết Ngữ nghĩa học và Từ điển học hiện đại trên thế giới.

Ngay với quan điểm “Từ điển học hệ thống” vốn được coi là một nền tảng lí luận quan trọng bậc nhất của Từ điển học Việt Nam, những năm gần đây quan niệm này cũng có nhiều thay đổi, cần được cập nhật hơn. Vì vậy, không phải ngẫu nhiên - như bạn đọc có thể thấy - chúng tôi lại bắt đầu những bài viết của mình ở Viện Từ điển học và Bách khoa thư Việt Nam bằng việc trở lại với câu chuyện về Từ điển học hệ thống: Một thành tựu của ngôn ngữ học Nga và Xô viết.

2. Đôi điều về lịch sử Từ điển học hệ thống

Đây không phải là một câu chuyện lịch sử hoàn toàn chỉ có “vui mà thôi” (và ở Việt Nam chuyện này có lẽ nhiều người còn chưa biết) vì nó gắn với một thời kì lịch sử đặc biệt của đất nước Nga lúc đó.

Những năm 1970-1990 của thế kỉ XX, ở Nga đã hình thành một trường phái ngữ nghĩa học thường được gọi tên là “Moskovskaja semanticheskaija shkola” (viết tắt: MSSH - Trường phái nghĩa học Moskva), với ba tên tuổi học giả lớn là: Zholkovskij, Mel’chuk và Apresjan, vốn được khởi đầu với những nghiên cứu tiên phong về Nghĩa học từ những năm 50-60 tại Phòng thí nghiệm Dịch máy (mashinyj perevod) của Trường đại học Sư phạm Ngoại ngữ Quốc gia mang tên Moris Torez (viết tắt: MGPI I JA) ở Moskva.

Sau khi nhân vật trụ cột Mel’chuk buộc phải di cư sang Canada (năm 1977), hoạt động của những người trong trường phái này ở Moskva đi theo hai hướng chính:

(i) Áp dụng mô hình lí thuyết nổi tiếng cuả Mel’chuk về “Ý <=> Lời” (Smysl <=> Tekst) vào chương trình máy tính ETAP, trong đó đáng chú ý có hệ thống dịch máy hai chiều Anh - Nga, Nga - Anh.

ETAP có ba điểm nổi bật là:

+ nhằm vào phân tích các văn bản (tekst), chứ không nhằm vào tổng hợp chúng;

+ tính đầy đủ (polnota);

+ tính hình thức (formal’nost’).

Điều này rất quan trọng là vì máy tính không thể làm công việc phân tích văn bản nếu:

+ không có đủ những từ điển cỡ lớn về các tổ hợp (kombinator); trong ETAP có hai từ điển tổ hợp tiếng Anh và tiếng Nga mỗi cuốn có khoảng 90.000 mục;

+ không có các bộ quy tắc hình thức để phân tích về Từ pháp học và Cú pháp học, không chỉ đối với các kết cấu cú pháp cơ bản mà kể cả rất nhiều các kết cấu cú pháp ngoại vi khác của ngôn ngữ đang khảo sát.

Nhờ có hai ưu thế này của ETAP mà dựa vào nó ta có thể có được một bức tranh rất đầy đủ về các kết cấu cú pháp, vượt xa những gì được trình bày trong các sách ngữ pháp tiềng Nga lâu nay.

Cũng nhờ có được một mô hình ngôn ngữ học như thế trên máy tính mà các nhà ngữ học Nga đã có thể đạt tới được những miêu tả chi tiết về một mục từ hay một quy tắc ngữ pháp nào đó, và có khả năng hoàn thiện những lí thuyết của họ mà điển hình và cụ thể - là vấn đề làm sao cung cấp và phân bổ tối đa các thông tin về ba yếu tố quan yếu vốn cấu thành nên một sự mô tả ngôn ngữ học đầy đủ - đó là Từ pháp, Cú pháp, Từ điển.

Hơn nữa, cũng là nhờ có công việc hoàn thiện ETAP mà Trường phái nghĩa học Moskva - chủ yếu là công sức của Ju. D. Apresjan (x. 1980, 1995) và các cộng sự của ông - đã có thể xây dựng nên lí thuyết về sự Miêu tả “thống nhất” hay “tích hợp” (integral’nyj) ngôn ngữ nói chung và lý thuyết về Từ điển học “hệ thống” (systemnnyj) nói riêng

(ii) Tiến hành việc biên soạn bộ mới Từ điển giải thích các từ đồng nghĩa tiếng Nga (viết tắt: NOSS) và nghiên cứu lí thuyết về ba vấn đề:

+ ngữ nghĩa học hiện đại;

+ bức tranh ngôn ngữ về thế giới (jazykovaja kartina mira);

+ từ điển học hệ thống.

Đây là công việc của nhiều học giả tên tuổi như: Apresjan, Boguslavskij, Glovinskaja, Iomdina, Levontina, Sannikov, Uryson, được thực hiện suốt từ những năm 1974 cho đến 2006 gần đây.

 Những nghiên cứu này, một mặt, cho phép mở rộng phạm vi áp dụng của nguyên lí “miêu tả tích hợp ngôn ngữ”: nó không còn chỉ bị giới hạn trong các địa hạt Từ pháp, Cú pháp và Từ điển nữa, mà vươn sang cả lĩnh vực Nghĩa học từ vựng và Nghĩa học ngữ pháp, sang cả Ngữ dụng học và các bình diện thông báo (kommunikativnyj) và ngôn điệu (prosodicheskij) của các từ vị (leksema).

Mặt khác, công việc biên soạn những nhóm từ, lớp từ có những thuộc tính tương đồng (nhưng lại đan chéo nhau rất phức tạp) trong các từ điển đã giúp cho các nhà nghiên cứu này có cơ sở để đề xuất khái niệm về “kiểu loại từ điển học” (leksikograficheskij tip, viết tắt là: LT) và lí luận về việc miêu tả toàn bộ vốn từ của một ngôn ngữ như một hệ thống có tổ chức chặt chẽ.

Với những thành tựu nghiên cứu nói trên của giai đoạn sau 1970, trên thực tế đã hình thành một “biến thể” mới của Trường phái nghĩa học Moskva, mà gần đây (năm 2006) Apresjan đề nghị gọi tên là: Trường phái nghĩa học Moskva Miêu tả tích hợp ngôn ngữ và Từ điển học hệ thống.

3. Cơ bản về Từ điển học hệ thống

3.1. Nhận xét chung

Không có tham vọng trình bày kĩ và sâu về những khái niệm lí thuyết và các phương pháp biên soạn của Từ điển học hệ thống, sau đây chúng tôi chỉ đi vào một số điểm mà theo chúng tôi nên làm rõ thêm trong bối cảnh học thuật ở nước ta.

Điểm đầu tiên cần thấy là tất cả các nghiên cứu của các nhà Từ điển học Nga đều nhắm tới hai mục đích:

+ Xây dựng một lí thuyết nghĩa học đại cương trong đó không chỉ dẫn ra một vài thí dụ đại diện để minh họa, mà phải là một khối tư liệu đồ sộ về từ ngữ của một ngôn ngữ tự nhiên nào đó (như trường hợp cụ thể ở đây là tiếng Nga chẳng hạn);

+ Ứng dụng lí thuyết này vào thực tế, cụ thể là vào các sản phẩm của từ điển học: các cuốn từ điển đơn ngữ và đa ngữ phục vụ cho đông đảo bạn đọc.

Điểm thứ hai cần thấy là Ngữ nghĩa học lí thuyết và Từ điển học hệ thống ở Nga có mối quan hệ qua lại, tương tác rất chặt chẽ: cái đầu là nền tảng lí luận cho cái sau, và cái sau là cơ sở thực tế có tính kinh nghiệm cho cái trước. Không thể làm từ điển tốt, nếu không dựa trên những nguyên lí và khái niệm của Nghĩa học hiện đại; và cũng không thể có những tìm kiếm nghĩa học thành công, nếu chỉ dựa trên tư liệu là những ví dụ ngữ liệu đơn lẻ (cho dù có thể rất thú vị). Nếu trước kia nhà lí thuyết Nghĩa học và nhà biên soạn Từ điển làm việc độc lập với nhau thì tình hình nay đã khác: Họ giống như hai “nửa” của cùng một nhà nghiên cứu ngôn ngữ và sự kết hợp này sẽ là động lực cho sự tiến lên những bậc thang thành công cao hơn của cả hai bên - Ngữ nghĩa học và Từ điển học.

3.2. Một số nguyên lí cơ bản của Từ điển học hệ thống

Xét về mặt lich sử, từ xưa, trong truyền thống Âu châu, từ điển ra đời lúc đầu là một thứ “cẩm nang” để tra các từ “khó”, nhằm có được sự dễ dàng trong đọc hiểu văn bản. Ý nghĩa của các từ khó này thường được giải thích thông qua những lời cắt nghĩa không quá đòi hỏi hoặc bằng các từ đồng nghĩa thông dụng hơn - đó chính là kiểu từ điển “thụ động” (passivnyj) cốt chỉ phục vụ cho việc “hiểu” nghĩa từ.

Tuy nhiên, từ giữa thế kỉ XIX, người ta dần ý thức được rằng cần phải có những từ điển “chủ động” (aktivnyj) - tức là có khả năng cung cấp đầy đủ thông tin về các đơn vị từ vựng của ngôn ngữ, không phải chỉ để thông hiểu chúng, mà còn để tạo sinh ra các văn bản từ chúng. Trong khoảng mấy thập kỉ gần đây, những nghiên cứu theo hướng từ điển “chủ động” này đã làm rõ ra một sự kiện là: những đòi hỏi nảy sinh từ nguyên lí về tính “chủ động” (đối với khối lượng thông tin từ điển học cần có của từ trong từ điển) hóa ra là hoàn toàn tương thích với những đòi hỏi nảy sinh từ những nguyên lí về tính “tích hợp” và tính “hệ thống” của các miêu tả ngôn ngữ trong Ngữ nghĩa học lí thuyết và Từ điển học hệ thống. Ba nguyên lí này (chủ động, tích hợp, hệ thống) sẽ giúp cho từ điển trở thành không chỉ là cái nền cơ sở kinh nghiệm cho Nghĩa học lí thuyết, mà còn là một cuốn sách giáo khoa thực hành cho những ai muốn nắm vững các kĩ năng tiếng mẹ đẻ hay ngoại ngữ của mình.

Nói đến bộ khung lí thuyết của Từ điển học hệ thống, trước hết, cần chú ý rằng nó thường được hình dung như là bao gồm những bộ phận sau:

+ những vấn đề chung:

- những nguyên lí và khái niệm cơ bản;

- phân loại cơ bản các vị từ (predikat);

- quy tắc tương tác giữa các ý nghĩa.

+ những vấn đề chuyên sâu hơn:

- “kiểu loại từ điển học” “(tức là “một lớp từ vị có nhiều thuộc tính chung, cùng phản ứng giống nhau với các quy tắc ngôn ngữ nhất định”);

- “chân dung từ điển học” (leksikograficheskij portret - tức là các trình bày mang tính tích hợp từ điển học) về các từ vị.

Do sự hạn chế về dung lượng của một bài báo, trong bài này chúng tôi sẽ chỉ đi sâu vào một số những vấn đề chung (còn những vấn đề chuyên sâu hơn, xin hẹn ở các bài báo tiếp sau); cụ thể ở đây là ba vấn đề đáng quan tâm:

+ Nguyên lí về tính hệ thống của vốn từ vựng;

+ Nguyên lí về tính tích hợp trong miêu tả ngôn ngữ;

+ Ý tưởng phục nguyên “bức tranh ngôn ngữ về thế giới”.

Xin lần lượt đi vào từng nguyên lí:

3.2.1 Nguyên lí về tính hệ thống của vốn từ vựng (Leksika)

Trong quan niệm của Từ điển học hệ thống, vốn từ vựng được xem xét như một hệ thống, và hệ thống các ý nghĩa từ vựng trong toàn bộ một cuốn từ điển được hình dung trên một cơ sở lí thuyết như sau:

+ Tập hợp các ý nghĩa từ vựng trong một ngôn ngữ được tổ chức một cách hệ thống (tuy rằng có thể kém hơn ngữ pháp);

+ Hệ thống từ vựng có các phương diện mang tính Phân loại và Thao tác.

- Với tư cách một hệ thống phân loại, vốn từ vựng có một tôn ti bao gồm các lớp hạng (class) và tiểu lớp (podklass) ngữ nghĩa đan chéo nhau nhiều lần;

- Với tư cách một hệ thống thao tác, vốn từ vựng có các quy tắc tương tác giữa các ý nghĩa trong văn bản (ở đây chỉ bàn đến các quy tắc không tầm thường/nhạt nhẽo - netrivialnyj).

Ta hãy xem điểm thứ nhất về:

a. Hệ thống từ vựng với tư cách một hệ thống phân loại

Từ góc nhìn này ta sẽ đụng chạm với hai vấn đề: các liên hệ ngữ nghĩa và các lớp hạng ngữ nghĩa.

Thí dụ, nếu phân tích chi tiết lời định nghĩa của 5 từ vị động từ: prosit’ ‘xin, thỉnh cầu’, trebovat’ ‘yêu cầu, đòi hỏi’, sprashivat’ 1 ‘hỏi 1’ - sprashivat’ 2 ‘hỏi 2’ - sprashivat’ 3 ‘hỏi 3’, ta sẽ thấy:

+ tất cả chúng đều có phản ánh những mối liên hệ ngữ nghĩa giữa các ý nghĩa của động từ đa nghĩa sprashivat’ ‘hỏi’ , cũng như những mối liên hệ giữa các từ vị: sprashivat’ 1 ‘hỏi 1’ và sprashivat’ 2 ‘hỏi 2’; sprashivat’ 2 ‘hỏi 2’ và prosit’ ‘xin, thỉnh cầu’; và cuối cùng là giữa sprashivat’ 3 ‘hỏi 3’ và trebovat’ ‘yêu cầu, đòi hỏi’;

+ tất cả những từ vị này đều thuộc về cùng một lớp hạng ngữ nghĩa biểu thị hành động nói năng của con người, do đó mà trong lời giải thích chúng đều hàm chứa cái ý (smysl): ‘nói (cho ai đó cái gì đó)’.

Bộ máy giải thích/định nghĩa mang tính phân tích của Từ điển học hệ thống, vì thế, có nhiệm vụ phát lộ những liên hệ mang tính hệ thống đó (hay nói khác đi, những sự tương đồng và dị biệt lặp lại, “xuyên suốt” đó) giữa các yếu tố của dãy đồng nghĩa, giữa các từ vị của từ đa nghĩa, giữa các từ đồng âm, giữa các từ chuyển loại, v.v.

Về nguyên tắc, các mục từ của tất cả các từ vị của một “kiểu loại từ điển học” phải tuân thủ một khuôn mẫu giải thích/định nghĩa thống nhất - tức là chứa đựng những thông tin cùng một kiểu về ý nghĩa của các từ vị và những thông tin như nhau về các thuộc tính từ pháp, cú pháp, các khả năng kết hợp, các thuộc tính thông báo - ngôn điệu của chúng, v.v.

Thí dụ, các động từ chuyển động khodit’ ‘đi bộ’, begat’ ‘chạy’, ezdit’ ‘đi xe’ đều có chung một ngữ trị (valentnost’) “mục đích” vốn được biểu thị rất khác nhau:

- khodit’/begat’/ezdit’ po delam/po magazinam (chú ý: danh từ phải ở cách 3 - Tặng cách)

- khodit’/begat’ na okhotu/na tancy (chú ý: danh từ phải ở cách 4 - Đối cách)

- khodit’/begat’/ezdit’ za khlebom, za gazetoi (chú ý: danh từ phải ở cách 5 - Công cụ cách)

- khodit’/begat’/ezdit’ kupat’tsja (chú ý: động từ phải nguyên thể)

Nói cách khác, chúng đều có chung một thuộc tính mang tính chất “kiểu loại” của một “kiểu loại từ điển học” và thuộc tính này phải được phản ánh trong lời định nghĩa tất cả các từ vị của các từ.

Việc xa rời nguyên lí “thống nhất” nói trên tuy nhiên có thể xảy ra, và điều đó chỉ có thể được chấp nhận khi mà ngữ liệu đối kháng lại với nó. Thí dụ trong nhóm các động từ chuyển động mà ta đang xét chỉ riêng động từ khodit’ là có thêm một cách thức biểu thị ngữ trị “mục đích” nữa, đó là dùng nhóm giới từ po cộng với danh từ ở cách 4: khodit’ po griby/ po jagody/ po vodu ‘đi tìm nấm/tìm quả dại/kiếm nước’; và thú vị nhất là trong ngân hàng dữ liệu tiếng Nga chứa tới 34.000.000 đơn vị không hề tìm thấy một kết hợp mà ta dễ nghĩ là thể nào nó cũng phải có mặt trong kho ngữ liệu: * khodit’ po cvety ‘đi tìm hoa’ !? Đây chỉ là một thuộc tính “cá nhân” (không phải “kiểu loại’) của “chân dung từ điển học” về động từ khodit’ và không thể gán ghép nó cho các động từ chuyển động khác cùng nhóm. Tuy nhiên, điều này không có nghĩa là ta không nói tới nó trong định nghĩa ở từ điển, bởi vì về nguyên tắc, cho dù lớn hay nhỏ, đã là một “Từ điển hệ thống” thì lí tưởng là mỗi mục từ đều đồng thời phản ánh trong nó cả những thuộc tính “kiểu loại từ điển học” cũng như những thuộc tính “chân dung từ điển học”.

TÀI LIỆU THAM KHẢO CHÍNH

[1] Hoàng Phê 1969, Về việc biên soạn một cuốn từ điển tiếng Việt phổ thông, Ngôn ngữ, s. 2.

[2] Hoàng Phê & Nguyễn Ngọc Trâm 1993, Một số vấn đề về từ điển học, Ngôn ngữ, s. 4.

[3] Nhiều tác giả 1997, Một số vấn đề về từ điển học, NXB Khoa học xã hội, Hà Nội.

[4] Chu Bích Thu 2001, Giới thiệu sơ lược về từ điển và từ điển học Việt Nam, Ngôn ngữ, s. 14.

[5] Apresjan Ju. D. 1995, Izbrannye trudy, t. 2, Integral’noe opisanie jazyka i systemnaja leksikografija, Moskva.

[6] Apresjan Ju. D. 2000, Systematic Lexicography, Oxford.

[7] Apresjan Ju. D. 2006 (chủ biên), Jazykovaja kartina mira i systemnaja leksikografija, Moskva.

[8] Zhonkovskii A. K., Mel’chuk I. A. 1967, O semanticheskoi sinteze // Problemy kibernetiki. vyp.19.

[9] Mel’chuk I. A. 1974, Opyt teorii lingvisticheskih modelej “Smysl <=>Tekst”, Moskva.

 [Còn tiếp; kì sau: b. Hệ thống từ vựng với tư cách một hệ thống thao tác]


 

                                    Tạp chí Từ điển học và Bách khoa thư, số 01, năm 2009