bot
(thảo luận · đóng góp)
Người chủNguyễn Xuân Minh
Cờ?Có(kiểm tra
Ngôn ngữ Python trên môi trường Mac OS X 10.4
Thư viện/khuôn khổpywikipediabot
29 tháng 4, 2007
Tổng số sửa đổi197.598 (Cập nhật lần cuối vào lúc 21:03, ngày 11 tháng 9 năm 2011 (UTC))


Minh đã mỏi tay vì gõ quá sức. Hình như tôi phải giúp đỡ.

Việc cần làm

Đây là danh sách các việc mà tôi định sẽ làm. Nếu bạn muốn tôi làm gì nữa, xin nhắn tin cho Minh hay ghi nó thẳng vào đây.

Tìm và thay

Tiến triển Miêu tả Mã nguồn cũ Mã nguồn mới
Việc làm hiện nay
Việc đang ngừng
  FVDP: Dời liên kết. Dời liên kết khỏi những từ thường gặp.
27 tháng 1, 2008
  Thêm phần chuyển tự vào các mục từ tiếng Nga. Đã làm phần lớn, nhưng cần phải sửa các từ không có trọng âm.
19 tháng 7, 2007 –
\{\{-rus-\}\}
(?![\r\n]+\{\{-translit-|[\r\n]+\{\{-rus-trans-)
(?=.*[\r\n]'''([^\r\n]*<u>.</u>[^\r\n]*)''')
lambda x: "{{-rus-}}\n{{-rus-trans-|" + "|".join(x.group(1).replace("<u>", "'").replace("</u>", "")) + "}}\n"
  FVDP: Cụm từ. Sửa các lỗi đặt liên kết cho từ ghép.
22 tháng 6 – 2 tháng 7, 4 tháng 7, 8 tháng 7, 15 tháng 7 – 17 tháng 7, 2007
Việc làm trong tương lai
  @. Viết các biểu thức chính quy để đổi tiêu bản {{term}} thành {{@}}.
  FVDP: Viết hoa các mục từ trong thể loại Thể loại:Viết tắt tiếng Anh và thay dòng cho biết cách đánh vần trong các mục từ đó.
  FVDP: Sửa những thông tin biến cách đã có trong dữ liệu FVDP để sử dụng tiêu bản. '''([^']*)''' \(''số nhiều'': \[\[[^']*\]\]\) {{eng-noun|pl=\2}}
'''([^']*)''' \(Số nhiều: \[\[[^']*\]\]\)
'''([^']*)''' \(\{\{plur\}\} ([^\)]*)\)
{{eng-verb|...}} tại en:
Việc đã làm xong
  Thay các liên kết đến w:IPA bằng Wiktionary:IPA.
30 tháng 4, 2007 – 21 tháng 5, 2007
* [[w:IPA|IPA]] : * [[Wiktionary:IPA|IPA]]:
*[[w:IPA|IPA]] :
  FVDP: Sửa lỗi xếp thể loại thường gặp trong các mục từ liên từ FVDP.
6 tháng 6, 2007
^conjonction[\r\n]+(.+)tiếng ([^\]]+)\]\] \\1tiếng \\2]]\n[[Thể loại:Liên từ tiếng \\2]]
tiếng ([^\]]+)\]\][\r\n]*conjonction tiếng \\1]]\n[[Thể loại:Liên từ tiếng \\1]]
  FVDP: Sửa những vấn đề quan điểm thường gặp trong định nghĩa của FVDP.
6 tháng 6, 2007
[[nước]] [[ta]] [[Việt Nam]]
  FVDP: Mở rộng những chú thích cho biết vị trí của định nghĩa
6 tháng 6, 2007 (làm bằng tay)
[TN] {{term|trong nước}}
[ĐL] {{term|Đài Loan}} (?)
  FVDP: Hợp nhất những định nghĩa bị PiedBot cắt ra từng dấu chấm phẩy.
6 tháng 6, 2007 – 10 tháng 6, 2007
^\# ((?:\{\{term\|[^\}]*\}\} *|; *|\([^\)]*\) *)*
(?:\[\[[^\]]*\|[^\]]*\]|[A-ZÀÁẢÃẠÂẦẤẨẪẬĂẰẮẲẴẶĐÈÉẺẼẸ
ÊỀẾỂỄỆÌÍỈĨỊÒÓỎÕỌÔỒỐỔỖỘƠỜỚỞỠỢÙÚỦŨỤƯỪỨỬỮỰỲÝỶỸỴ])
[^\r\n]*[^\.\r\n])[\r\n]+\# (\[\[[^\|]*\]|[^A-Z
ÀÁẢÃẠÂẦẤẨẪẬĂẰẮẲẴẶĐÈÉẺẼẸÊỀẾỂỄỆÌÍỈĨỊÒÓỎÕỌÔỒỐỔỖỘƠỜỚỞỠỢ
ÙÚỦŨỤƯỪỨỬỮỰỲÝỶỸỴ])
# \1; \2
  FVDP: Thay {{-verb-}} bằng {{-tr-verb-}}, {{-intr-verb-}}, và {{-aux-verb-}}.
9 tháng 7, 2007 – 15 tháng 7, 2007
^\{\{-verb-\}\}[\r\n]+([^\r\n]*ngoại động từ) {{-tr-verb-}}\n\\1
^\{\{-verb-\}\}[\r\n]+([^\r\n]*nội động từ) {{-intr-verb-}}\n\\1
^\{\{-verb-\}\}[\r\n]+([^\r\n]*trợ động từ) {{-aux-verb-}}\n\\1
  Thay {{-pr-noun-}} bằng {{-place-}} trong các mục địa danh tiếng Việt.
2 tháng 9 – 3 tháng 9, 2007
\{\{-pr-noun-\}\}(?=[\r\n]+'''[A-Z
ÀÁẢÃẠÂẦẤẨẪẬĂẰẮẲẴẶĐÈÉẺẼẸÊỀẾỂỄỆÌÍỈĨỊÒÓỎÕỌÔỒỐỔỖỘƠỜỚỞỠỢ
ÙÚỦŨỤƯỪỨỬỮỰỲÝỶỸỴ].*[\r\n]+# [^\r\n]*(?:Một|\[\[một
\|Một\]\]|\[\[tên gọi|Tên gọi\]\] các) \[\[(?:làng|thị|xã|phường|thành|phủ|quận|huyện|tỉnh|sông|núi
|hồ|vịnh|đảo|quần|dòng))
\\1[[Thể loại:Địa danh tiếng Việt]]
(\{\{-place-\}\}.*)\[\[Thể loại:Danh từ riêng tiếng Việt\]\] [[Thể loại:Địa danh tiếng Việt]]
  FVDP: Thay Thể loại:Tiếng Pháp bằng Thể loại:Mục từ tiếng Pháp. Xây dựng Thể loại:Tự động từ tiếng Pháp.
9 tháng 9 – 12 tháng 9, 2007, 18 tháng 9, 2007
\[\[Thể loại:Tiếng Pháp\|([^\]]*)\]\][\r\n]+(?=.*\[\[Thể loại:Tiếng Pháp\|)
\[\[Thể loại:Tiếng Pháp\|([^\]]*)\]\] [[Thể loại:Mục từ tiếng Pháp|\\1]]
\{\{-verb-\}\}(?=[\r\n]+'''[^\r\n]+tự động từ) {{-ref-verb-}}
(\{\{-ref-verb-\}\}.*)\[\[Thể loại:Động từ
tiếng Pháp\|([^\]]+)\]\]
\\1[[Thể loại:Tự động từ tiếng Pháp|\\2]]
  Đổi các tiêu bản ngôn ngữ ISO theo dạng {{xxx}} để sử dụng {{tiếng}}.
28 tháng 9
^[^<]+
import re
def langdelink_repl(x):
    nolink = re.sub(r"\[\[([^\|\]]+)(?:\|[^\]]+)?\]\]", r"\1", x.group(0))
    plain = nolink.replace("''", "").replace("'''", "")
    lc = re.sub(r"^\[\[([^\|\]]+)(?:\|[^\]]+)?\]\]", r"[[\1]]", x.group(0))
    result = u"{{tiếng|style={{{style|}}}|%(default)s|plain=%(plain)s|nolink=%(nolink)s|lc=%(lc)s}}" % \
             {"default": x.group(0), "plain": plain, "nolink": nolink, "lc": lc}
    return result
plain=(?P<plain>[^\|]+)\|nolink=(?P=plain)\| plain=\g<plain>|
  @. Tập hợp lại các lần gọi {{term}} ở đây để biết cần tại ra tiêu bản @ nào. Xem {{@}}.
5 tháng 11, 2007 – 12 tháng 11, 2007
  Thay thế {{VieIPA}} bằng {{vie-pron}}
11 tháng 9, 2011 – 2 tháng 10, 2011
(?mu)^\* *\[\[(?:.*?IPA\|)?IPA\]\]: *
\{\{IPA\|/((?:\{\{ *VieIPA *[|\w]+\}\} *)+)/\}\} *(\r$)
import re
def replaceVieIPA(match):
    ipa = match.group(1)
    words = re.split(r'\}\} +\{\{ *VieIPA *\|',
                     ipa.strip()[ipa.find('|')+1:-2])
    words = [word.replace('|', '') for word in words]
    return "{{vie-pron|%s}}" % "|".join(words)
  FVDP: Các mục từ có / trong tham số của {{nor-noun}}{{nor-verb}}, như dropskjede. Đã làm bằng tay, chỉ cần kiểm lại dùng bot để chắc chắn. Các bản mẫu hiện có khả năng phân tích các dấu phân tách.

Tạo mới

Tiến triển Miêu tả Nguồn
  Các địa danh Việt Nam. Đã bỏ dữ liệu vào CSDL; cần viết mục từ mẫu và tìm cách để nhận ra nếu tên không tuân theo chính tả tiếng Việt, để khỏi bể tiêu bản {{VieIPA}}. NGA/GNS
  Các địa danh Hoa Kỳ. Đã bỏ dữ liệu của tiểu bang Ohio vào CSDL; cần viết mục từ mẫu và tập hợp các thành viên lớn hay quan trọng hơn trùng với địa danh Ohio, như là Toledo (Ohio vs. Tây Ban Nha). USGS/BGN
  Phần FVDP còn lại. PiedBot bỏ qua nhiều bài vì những lý do nhỏ. Sẽ cần liệt kê dứt khoát những vấn đề phải giải quyết trước khi nhập những bài này vào đây. FVDP

Chưa xếp

phải trở thành:
  1. Toàn bộ nói chung những vật rời được lại với nhau
    Một hoa.
    đuốc.
  • Và ngược trở lại, cũng có một số định nghĩa trong mục từ địa danh bị cắt đứt vì có dấu chấm. Điều này sẽ khó giải quyết hơn.
  • Những mục từ kinh tế "mèo Xiêm" có hai thuật ngữ trong một mục từ.
  • {{see-entry|xxxx|Xxxx}}, {{like-entry|xxxx|Xxxx}}
  • & phó từ (thí dụ swift)
  • (Số nhiều: [[xxx]] hoặc [[yyy]]) (như ở terrarium)
  • Xếp các từ vần (rhyming) theo âm tiết cuối.
  • <nghia den><b?ng>", "(econ)", "<nhạc>", "<bóng>", "<thgt>", "[[<Mỹ>|<Mỹ>]]", "<qsự>", "<hải>"
  • Dời các liên kết đến Wiktionary tiếng Klingon (tlh) đã đóng cửa.
  • Đánh dấu các mục từ chỉ đến nhau một cách tuần hoàn dùng {{see-entry}} hay {{like-entry}}.
  • lânh đạo, lânh đạm, etc.