Wiktionary:Nguồn gốc/WinVNKey/Lê Sơn Thanh

Thông tin chữ Hán và chữ Nôm dựa theo cơ sở dữ liệu của phần mềm WinVNKey, đóng góp bởi học giả Lê Sơn Thanh; đã được các tác giả đồng ý đưa vào đây.

Lời xin phép tái sử dụng phần mềm

Thư này được gửi từ Trần Thế Trung đến Ngô Đình Học:

WinVNKey database of Han-Nom for use in free Vietnamese Wiktionary

Dear Hoc D. Ngo,

I am Tran The Trung, member of the free online Vietnamese Mutilingual Dictionary Wiktionary - a project of Wikimedia (best known for their Wikipedia):

The free Vietnamese Wiktionary is a project of creating freely contributed and reused dictionary describing as many languages as possible for any speaker of Vietnamese. Entries are licenced in GNU Free Document Licence (GFDL) which allow collaboration of peoples all over the Internet to contribute together; modeled after open source softwares.

The project has received generous contribution from the Free Vietnamese Dictionary Project led by Ho Ngoc Duc; where a large database in English-Vietnamese, French-Vietnamese, Russian-Vietnamese, German-Vietnamese and Vietnamese-Vietnamese are released with GFDL licence and thus being incoporated into over 100.000 current entries of Wiktionary.

Unfortunately the above mentioned database of Vietnamese-Vietnamese dictionary lack information about how Quoc Ngu entries are written in Nom.

In the search for possible free database of Quoc Ngu-Nom dictionary, I have found the database incorporated in WinVNKey; which is highly useful and rich.

The Han-Nom database in WinVNKey would much enhance the richness of information for Vietnamese entries on Wiktionary, further helping preserve the Nom heritage by letting user of Wiktionary aware of Nom information on each Vietnamese entry.

I therefore ask you for your permission to use the Han-Nom database of WinVNKey, which itseft a non-profit and open-free project just like Wiktionary, in the Wiktionary entries, with GNU Free Document Licence (or any compatible licence). For each use, there will be a mention to WinVNKey database, or eventually each contributor to each datafile, as indicated in each data file.

For an example of how information on Nom writing is pluged into a Vietnamese entry, you can see the definition of "chè" at http://vi.wiktionary.org/wiki/ch%C3%A8

I looking forward to your kind support, any of your help on how to obtain free database of Han-Nom into Wiktionary would be much appreciated.

Tran The Trung.

P.S. I am writing this email from a Linux console which has no Unicode support, therefore I must write in English, though my English is poor. Excuse me for my bad English, if your email program can read Vietnamese (Unicode) I will write in Vietnamese next time.

Lời cho phép tái sử dụng phần mềm

Thư này được gửi từ Ngô Đình Học đến Trần Thế Trung ngày 14 tháng 9 năm 2006 lúc 21:14:40 giờ PDT:

Re: WinVNKey database of Han-Nom for use in free Vietnamese Wiktionary

Dear Trung:

Thanks for your interest in WinVNKey Han/Nom databases. I'm happy that you and many other people have taken the initiative to lead this dictionary project for the benefits of all users world wide.

Personally I am delighted to see my work recognized and useful to other people. I have no objection to you using any database.

But the true author of the Nom database is Mr. Lê Sơn Thanh, aka Khuc-Than, who is a Han/Nom scholar currently living in France. He has genereously donated his Han/Nom databases to WinVNKey in the hope that everyone can benefit from it. But as a courtesy, you should write to him and ask for permission. I think he would be happy to grant you permission to use his database.

FYI, the Han/Nom databases are still in development and various authors are working on them. They constantly update/correct the databases with new characters found in classic literature. Mr. Thanh promised to release updates to WinVNKey regularly. That means you should design your dictionary in such a way that users of your dictionary can access the latest WinVNKey Han/Nom files.

Thus perhaps the best way is for me to put these individual Han/Nom database text files in the CVS archive at http://winvnkey.sf.net so that you and everyone can reference them easily. In this way you are guaranteed to get the latest revision. For now I am very busy, but perhaps in a week or two I will have time to redesign and check the files in.

BTW, if it's easier for you to write in Vietnamese, feel free to do so. I can read Vietnamese Unicode. For me it's faster to write in English because there are no accent marks to type :-)

Thanks

Hoc Ngo

Lời xin phép tái sử dụng cơ sở dữ liệu

Thư này được gửi từ Trần Thế Trung đến Alexandre Lê Sơn Thanh qua Ngô Đình Học ngày 15 tháng 9 năm 2006. Văn bản bên dưới được chuyển đổi từ VIQR:

Xin phép sử dụng công trình Hán/Nôm trong WinVNKey của ông

Kính gửi ông Lê Sơn Thành,

Qua một trao đổi với Hoc D. Ngo (với nội dung được ghi lại bên dưới), tôi được biết ông là tác giả của cơ sở dữ liệu Hán/Nôm dùng bởi nhu liệu WinVNKey.

Trước hết hân hạnh được cám ơn ông đã gây dựng cơ sở dữ liệu Hán/Nôm, giúp hậu thế dễ dàng tiếp cận di sản của cha ông.

Hiện nay, tôi đang cùng với nhiều người xây dựng từ điển trực tuyến, tự do và đa ngôn ngữ Wiktionary. Ðây là một dự án của Wikimedia (tổ chức này vốn nổi danh với dự án Wikipedia).

Từ điển này đã nhận được hảo tâm của một số tác giả để có được một số lượng đáng kể mục từ tiếng Việt. Tuy nhiên các mục từ tiếng Việt (viết bằng Quốc Ngữ) không có thông tin cách viết trong chữ Nôm. Trong khi tìm cơ sở dữ liệu Quốc Ngữ - Hán/Nôm tự do, tôi tình cờ được biết tới công trình của ông nằm trong nhu liệu tự do WinVNKey.

Cơ sở dữ liệu Hán Nôm của ông thật quý, nó có thể giúp độc giả Wiktionary tăng hiểu biết về chữ Nôm mỗi khi tra từ tiếng Việt. Ví dụ về cách thêm thông tin cách viết chữ Hán/Nôm trong mục từ có thể thấy tại http://vi.wiktionary.org/wiki/ch%C3%A8

Tôi viết email này, theo gợi ý của Hoc D. Ngo, để xin phép ông mở lòng hảo tâm đồng ý cung cấp công trình của ông cho sự sử dụng của công chúng tại Wiktionary, theo điều khoản Giấy phép Tài liệu Tự do GNU (GNU Free Document License) hoặc theo các giấy phép sử dụng tương thích. Mỗi mục từ có sử dụng thông tin trong công trình của ông sẽ đều ghi chú thích rõ tác giả là ông, và liên kết Internet đến nguồn gốc nếu cần.

Tôi rất mong đợi sự ủng hộ của ông cho dự án Wiktionary, và tin rằng sự giúp đỡ của ông sẽ gia tăng cơ hội cho mọi người dược hiểu biết về di sản chữ Hán/Nôm.

Xin chân thành cảm ơn và mong hồi âm.
Trần Thế Trung.

Tái bút: nếu nhu liệu đọc thư điện tử của ông hỗ trợ Unicode, tôi có thể trao đổi bằng tiếng Việt Unicode để giúp ông dễ đọc.

Lời hồi âm cho phép tái sử dụng cơ sở dữ liệu

Thư này được gửi từ Alexandre Lê Sơn Thanh đến Trần Thế Trung và Ngô Đình Học ngày 16 tháng 9 năm 2006 lúc 20:29:33 giờ UTC. Văn bản bên dưới được chuyển đổi từ VIQR:

Re : Fwd: Re: Xin phép sử dụng công trình Hán/Nôm trong WinVNKey của ông

Các Bác Học và Trung kính,

Tôi xin chân thành cám ơn sự quan tâm của hai bác về Hán Nôm và về cơ sở dữ liệu mà tôi đã nhập và tập hợp từ nhiều nguồn khác nhau. Nhưng chỉ với mục đích là làm sao gõ được càng nhanh chóng càng tốt. Nó khg có những đặc tính quy phạm hay sư phạm của từ điển học. Muốn đánh một chữ "sang" đang tìm thì chỉ cần qua quốc ngữ thì sẽ hiện lên tất cả các chữ "sang" dù là gốc nôm hay Hán.

Riêng về Wikipedia, tôi có sử dụng nhiều nên cũng ý thức được tầm quan trọng của những dự án đại chúng của Hôi.

Vấn đề đặt ra là sử dụng CSDL Nôm của tôi thì đó khg phải là vấn đề quan trọng vì một khi đã công bố rộng rã qua WinVNKey, các dữ liệu khg thuộc về tôi nữa. Nhưng có một điều làm tôi hơi lo là tôi toi chỉ mới hiểu sơ qua về dự án của Bác Trung nên khg hình dung ra được sự tiện ích của CSDL đó trong một dự án TÐ Tiếng Việt.

Ðiều làm tôi lo là đối với chữ nôm, ta khg thể quan niệm chúng đơn thuần là "chữ", mà theo tôi nghĩa ta nên tiến cận chúng qua quan hệ "chữ_âm đọc_nghĩa".

Ðó là quan hệ trung tâm đối với một chữ nôm. Ngay cả Tự điển chữ nôm Trích dẫn mà tôi có tham gia cũng khg đáp ứng hay phản ảnh đúng quan hệ này để tránh sai lầm.

Sai lầm đến từ tính đồng âm & quá cao của tiếng Việt. Tôi xin lấy thí dụ cụ thể để Bác Trung hiểu rõ ý tôi hơn:

Ðể viết chữ "sang" trong "sang sông" (SANG A)], người ta đã dùng bộ "sước" [chỉ hành động "đi" của khái niệm-->nghĩa phù] và chữ "lang" để ghi âm [--> âm phù]. Trừ thắc mắt "l"-->"s" ra, về ngữ nghĩa và tổ chức các yếu tố thì tất cả đều hợp lý.

Song, cũng chữ sang đó [sước+lang] cũng được dùng để ghi âm cho chữ "sang" trong "giàu sang", trong "sửa sang" (SANG B). Như vậy giải thích âm phù và nghĩa phù cũ là khg hợp lý. Ðây là một vay mượn mới, tức cả chữ "SANG A" mới là âm phù cho chữ mới.

Như vậy trong TD của Bác Trung, tôi khg biết Bác định sắp xếp như thế nào.

Tôi khg biết làm thế nào để đưa chữ nôm vào một chữ khi có đồng âm.

Nhưng nếu vấn đề đó khg phức tạp lắm vì theo nguyên tắc, chữ thuần nào cũng có thể viết bằng bất cứ cách nào, vấn đề chữ Hán lại phức tạp hơn nhiều vì một chữ có một cách viết (còn 2,3 cách viết khác là dị thể).

Tôi thiết nghĩ, để làm tốt việc này ta phải xác định:

  1. Hễ có chữ Hán Việt nào thì phải có chữ Hán chuẩn đi kèm.
  2. Chữ nôm thì phải tùy theo nghĩa của chữ mà xác định chữ nôm nào đi với tiếng nào trong tiếng Việt và nếu có nhiều cách viết thì làm sao cho hợp lý.

Xem ra cũng nhiều việc tra cứu và thẩm định lắm.

Riêng tôi, tôi đang làm nhiều việc theo chiều hướng này: Lập bảng từ (nomenclature) cho Hán Việt trong tiếng Việt. Nhưng chư xong.

Tóm lại là về việc sử dụng DB Nôm đó, đối với tôi khg vấn đề gì đặc biệt. Bác có thể đưa vào Wiki nếu thấy có nhu cần. Song cũng xin nói thêm là tôi cũng thường xuyên vập nhật như bác học đã nói. nhưng vấn đề này ở đây khg quan trong lắm.

Xin hẹn hai bác thư sau vì có lẽ tôi đã nói hơi nhiều và rối. Nếu có ý kiến gì thì xin cho tôi biết để suy nghĩ lại.

Kính mến

Lê Sơn Thanh

TB.: [xóa chuyện phiếm]