تصحیح خودکار کلمات فارسی

سال ۱۳۸۷ بود. باید متن سخنرانی‌های نویسنده‌ای را پیاده می‌کردم. ساعت‌ها سخنرانی بود و قرار بود در ‌نهایت کتابی از دلِ آن چاپ شود. نویسنده برایم بس عزیز بود. پا به سن گذاشته بود و می‌ترسیدم امروز و فردا رخت سفر ببندد. بنابراین باید با سرعت تایپ می‌کردم و سرعت، احتمال خطا را بیشتر می‌کرد. نیم‌فاصله‌ها و تنوین‌ها و کلمات تشدید‌دار سرعت کار را کم می‌کردند. سخنرانی هم پر بود از کلمات مرکب و قید و… .

رفته‌رفته به این نتیجه رسیدم که بهتر است در پایان هر روزِ کاری، کلمات پُر‌بَسامد را به بخش تصحیح خودکار (Auto-Correct) واژه‌پرداز اضافه کنم. بعد از هشت ماه، شد تقریباً ۶۲۰۰ کلمه.

به برنامه‌های باز‌متن (Open-Source) علاقهٔ زیادی داشتم و آن زمان معادلِ باز‌متن مایکروسافت آفیس، مجموعه نرم‌افزارِ اداریِ اپن‌آفیس (OpenOffice) بود. مقاله‌ای نوشتم و در آن با تصاویری گویا مراحل اضافه‌کردن بانک کلمات را برای کاربرانش توضیح دادم. از آن استقبال شد و تشویق شدم. با خودم گفتم، همهٔ کاربران حوصلهٔ طی کردن آن مسیر را ندارند، بنابراین بهتر است این بانک به‌طور پیش‌فرض در خود برنامه گنجانده شود.

سخت نبود. فایل جدیدی در بخش گزارش اِشکال باز کردم و موضوع را به گوش برنامه‌نویسان رساندم. کاربران علاقه‌مند هم پشتش ایستادند و با رأی‌هایشان آن‌ها را از اهمیت موضوع آگاه ساختند. چه شوری بود!

مقاله‌ام را هم ضمیمهٔ آن گزارش کردم. فارسی بود. انگلیسی‌اش را خواستند. دوست انگلیسی‌دانی زحمتش را کشید. مقالهٔ انگلیسی را همراه با فایل کلمات برای برنامه‌نویس‌ها فرستادم. کوتاه‌مدتی بعد، بانک کلمات به اپن‌آفیس اضافه شد و زبان فارسی هم به فهرست زبان‌های ویژگیِ «تصحیح خودکار» این برنامه افزوده شد.

اپن‌آفیس مدتی بعد از رونق افتاد و تیم تازه‌نفس و خوش‌فکر لیبره‌آفیس (Libreoffice) کار را دست گرفت. خوشبختانه نه زبان فارسی را حذف کردند و نه آن بانک را. بانک کلماتْ حجیم بود و باز شدن فهرستش با قدری تأخیر همراه بود. کمی بعد، با بهینه‌سازی‌هایی که کد برنامه پیدا کرد، این مشکل هم حل شد.

اکنون جدید‌ترین نسخهٔ لیبره‌آفیس نسخهٔ ۶.۳ است و زبانِ فارسی و آن بانک در آن خوش نشسته‌اند و در این سایت شما را انتظار می‌کشند. این زیردامنه هم بخش فارسی وب‌سایت لیبره‌آفیس است.

پرسش‌هایی که ممکن است به ذهن شما خطور کند:

۱ـ آیا صورت صحیح کلمات فارسی مطابق با دستور خط فرهنگستان زبان و ادب فارسی است؟
بله، منبعِ استناد املای کلماتْ کتاب «فرهنگ املایی فارسی» بوده است. با این حال اگر سهواً اشتباهی در کلمات افزوده‌شده وجود دارد، لطفاً تذکر بدهید تا اصلاح شود.

۲ـ آیا می‌شود کلمات این بانک را از دل این برنامه بیرون کشید و در برنامه‌هایی مانند مایکروسافت‌وُرد از آن استفاده کرد؟
از نظر فنی بله، اما از نظر اخلاقی نه. فایل بانک کلمات را با مجوز بازمتنِ Creative Commons منتشر کرده‌ام و استفاده از آن در برنامه‌های تجاری، با توجه به نوع مجوز، ممنوع است. این را نیک می‌دانم که کم هستند در ایران کسانی که لیبره‌آفیس را ترجیح دهند، اما از آن‌جا که راضی نیستم با افزودن این بانک، ناخواسته کسی را به استفاده از یک نرم‌افزارِ معمولاً قفل‌شکسته تشویق کنم، ترجیح دادم بانک را لااقل فعلاً فقط برای آفیسی بازمتن عرضه کنم. اجازه بدهید یک‌بار هم اغنیا سرِ سفرهٔ فقرا بنشینند. این را هم اضافه کنم که شرکت‌های فرصت‌طلب و راحت‌خواه اهمیتی به نارضایتی من نمی‌دهند و هیچ بعید نیست که در آیندهٔ نزدیک این بانک را به خودِ من هم بفروشند! متأسفانه برای این بخش ماجرا کاری از دستم ساخته نیست!

9 نظر در “تصحیح خودکار کلمات فارسی

  1. جناب افشین بسیار ممنونم از شما که این کار ارزشمند رو انجام دادین. از اینکه کسایی مثل شما هستن که به لیبره آفیس فارسی کمک می کنن خوشحالم.
    مدتیه که تصمیم گرفتم قانون کپی رایت رو رعایت کنم، برای همین هم یک لپ تاپ خریدم که ویندوز و آفیس داشت.
    گاهی که آفیسم به مشکل بر می خوره به لیبره آفیس مراجعه می کنم. از اینکه از فارسی پشتیبانی می کنه و کسایی مثل شما هستین که پاسخ مشکلات رو می دن دلگرم می شم. امیدوارم روزی برسه که قانون کپی رایت در کشور ما رعایت بشه و بتونیم از نرم افزارهای قفل شکسته مهاجرت کنیم.

    • لطف دارید.
      مایهٔ خوشحالی است که کسی با وجود داشتن آفیسی قانونی و اصل باز هم به استفاده از لیبره‌آفیس مشتاق باشد.

  2. سلام
    واقعا باید به شما افتخار کرد بابت چنین کار بزرگی
    من شخصا به شما افتخار میکنم و آرزوی توفیق روز افزون دارم

    • سلام.
      لطف دارید ایلیای گرامی. ممنونم و خودم را قابل به این‌همه لطفتان نمی‌دانم.

    • سلام.
      اگر بانک کلمات فارسیِ خودِ لیبره‌آفیس برایتان کافی است که هیچی، کار خاصی نباید بکنید؛ ولی اگر می‌خواهید کلمه‌ای را به آن افزوده یا بکاهید، باید پنجرهٔ تصحیح خودکار را باز کنید و فرایند افزودن یا کاهیدن کلمات را طی کنید.

      • این رو میدونستم؛ فکر کردم دیکشنری خاصی رو براش فراهم کردین که بشه اضافه کرد…
        همچین چیزی رو سراغ ندارید؟ چون فرآیند اضافه کردن کلمات اگر دونه دونه باشه تقریبا بی‌استفاده‌ست 🙁

        • واژه‌ها در یک فایل با نام DocumentList.xml ذخیره شده‌اند که مسیرش این است:

          home/username/.config/libreoffice/4/user/autocorr

          فایل را در یک واژه‌پرداز باز کنید و کلمات دلخواهتان را به‌سادگی اضافه یا حذف کنید.
          ضمناً در مسیری که عرض کردم به‌جای username نام کاربری خودتان را وارد کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *