نسخهٔ جدید بانک کلمات غلط فارسی

نسخهٔ جدید بانک کلمات غلط فارسی

مدتی پیش نسخهٔ جدیدی از بانک کلمات غلط فارسی را در اختیار توسعه‌دهندگان لیبره‌آفیس گذاشتم.
امروز و هم‌زمان با انتشار لیبره‌آفیس ۲۵.۸.۱ کلمات اضافه‌شده هم در لیبره‌آفیس قرار گرفتند.
علاوه بر کلماتِ جدید چندین کلمه را هم که به رسم‌الخط مرتبط بودند و غلط املایی قلمداد نمی‌شدند از بانک حذف کردم.
با توجه به اصلاحاتِ صورت‌گرفته می‌شود گفت که الان این بانک در وضعیت کم‌وبیش بهینه‌ای قرار گرفته است.

نیم‌فاصله‌های کاذب

نیم‌فاصلهٔ کاذب

یکی از چالش‌های متون فارسی وجود نیم‌فاصله‌های کاذب است. ظاهری شبیه به نیم‌فاصله دارند، اما در حقیقت نویسه‌های دیگری هستند.
این نویسه‌ها خصوصاً وقتی از یک سند به سند دیگری کپی می‌شوند، می‌توانند باعث نمایش نادرست متن، به‌هم‌ریختگی خطوط و مشکلاتی در جست‌وجوی محتوا شوند.

در واژه‌پرداز لیبره‌آفیس با کمک عبارت‌های باقاعده می‌شود همهٔ آن‌ها را یافت، اما استفاده از آن زحمت‌های خاص خودش را دارد. بنابراین با کمک هوش مصنوعی یک ماکروی پایتون ساختم که همان کار را بی‌دردسر و بدون خطا انجام بدهد.
این ماکرو همهٔ نیم‌فاصله‌های کاذب (که ۷ تا هستند) را پیدا و اصلاحشان می‌کند. در پایان کارش هم یک گزارش از نتیجهٔ اصلاحاتش می‌دهد.

1. Soft Hyphen (SHY) ← کد یونیکد: U+00AD
2. Not Sign ← کد یونیکد: U+00AC
3. Right-to-Left Mark (RLM) ← کد یونیکد: U+200F
4. Four-Per-Em Space ← کد یونیکد: U+2005
5. Zero Width No-Break Space (BOM, ZWNBSP) ← کد یونیکد: U+FEFF
6. Zero Width Space (ZWSP) ← کد یونیکد: U+200B
7. Zero Width Joiner (ZWJ) ← کد یونیکد: U+200D

📥 ماکرو را می‌توانید از اینجا یا اینجا دریافت کنید.

لیبره آفیس 25.8 منتشر شد

لیبره آفیس 25.8 منتشر شد

بنیاد مستندات (TDF) انتشار لیبره آفیس نسخه 25.8 با ویژگی‌های جدید و تعداد زیادی رفع اشکال را اعلام کرد. لیبره آفیس برای ویندوز (پردازنده های اینتل و آرم)، macOS (پردازنده‌های اپل سیلیکون و اینتل) و لینوکس (اینتل در قالب DEB و RPM) عرضه می‌شود که شما می‌توانید متناسب با رایانه خودتان آن را از آدرس دانلود همیشگی لیبره آفیس دریافت و نصب کنید:

https://www.libreoffice.org/download/

برای دیدن ویژگی‌های جدید لیبره آفیس 25.8 که از شماره‌گذاری جدید مبتنی بر سال و ماه میلادی استفاده می‌کند، به آدرس زیر مراجعه کنید:

https://wiki.documentfoundation.org/ReleaseNotes/25.8

در این نسخه نیز اشکالات مهمی مرتبط با خط و زبان فارسی حل شده است. برای استفاده از خروجی بهبود یافته، پیشنهاد می‌کنم نسخه 25.8 را دانلود و نصب کنید.

سند فارسی و قفل شدن لیبره‌آفیس

ظاهراً و بر اساس این گزارش در نسخهٔ در حال توسعهٔ لیبره‌آفیس اگر سندی فارسی باشد و قالب (فرمت) فایل هم DOC باشد، لیبره‌آفیس در زمان باز کردن سند قفل می‌کند و عملاً نمی‌شود از آن استفاده کرد.

مشکل کوچکی نیست، اما خوشبختانه برطرف شده و در نسخهٔ 25.8 لیبره‌آفیس وجود نخواهد داشت.

دردسرهای تراز

وقتی در برنامه‌ای مثل لیبره‌آفیس متنی به فارسی یا عربی می‌نویسید، چنانکه می‌دانید این زبان‌ها از راست به چپ نوشته می‌شوند. اما گاهی اوقات لازم است که یک قسمت از متن مثلاً یک جملهٔ انگلیسی یا اعداد و فرمول‌های خاص را از چپ به راست بنویسید. این کار را می‌توانید با تغییر جهت نوشته انجام دهید.

در اینجا متأسفانه مشکلی وجود دارد: وقتی قسمتی از یک سند فارسی را تنظیم می‌کنید که به صورت چپ به راست نمایش داده شود و در عین حال می‌خواهید که متن کاملاً مرتب و صاف در دو طرف صفحه قرار بگیرد (یعنی مثل روزنامه‌ها، از هر دو طرف چپ و راست به خطوط فرضی حاشیه بچسبد)، لیبره‌آفیس قاتی می‌کند!

به زبان ساده، نرم‌افزار نمی‌تواند درست حساب و کتاب کند که هر کلمه و حرف چقدر فضا نیاز دارد تا هم از چپ به راست نمایش داده شود و هم دو طرفش صاف باشد. نتیجه‌اش این می‌شود که قسمتی از متن از حاشیهٔ صفحه بیرون می‌زند و دیگر دیده نمی‌شود یا اینکه ظاهر سندتان را خراب می‌کند.

این مشکل در اینجا گزارش شده است و امیدواریم تا پیش از انتشار نسخهٔ پایدار بعدی برطرف بشود.

دانمارک و لیبره‌آفیس

دولت دانمارک تصمیم گرفته است که به‌تدریج محصولات مایکروسافت را کنار بگذارد و به‌جای آن‌ها از نرم‌افزارهای متن‌باز استفاده کند. دلیل اصلی این اقدام افزایش حاکمیت دیجیتال کشور است.

بر اساس این تصمیم نزدیک به نیمی از کارمندان وزارت امور دیجیتال دانمارک، سیستم‌عامل خود را از ویندوز به لینوکس و مجموعه‌نرم‌افزاری اداری خود را از آفیس ۳۶۵ به لیبره‌آفیس تغییر خواهند داد.

این حرکت بخشی از استراتژی دیجیتالی شدن دولت دانمارک است و هدف آن کنترل بیشتر بر زیرساخت‌ها و داده‌های دیجیتال است. با وجود اینکه ممکن است مشکلاتی در این مسیر پیش بیاید و به‌طور موقت نیاز به بازگشت به محصولات مایکروسافت باشد، اما دولت قاطعانه قصد دارد وابستگی خود را به شرکت‌های بزرگ فناوری کاهش دهد.

حل شدن مشکل هم‌پوشانی حروف فارسی

لیبره‌آفیس ۲۵.۲.۴ امروز منتشر شد. آنچه در این نسخه برای ما به‌عنوان یک کاربر فارسی‌زبان اهمیت دارد حل شدن مشکل (باگ) هم‌پوشانی حروف فارسی در جعبه‌های متنی است.

مشکل این بود که حروف فارسی وقتی در یک جعبهٔ متنی (Text Box) به صورت تراز شده (Justified) قرار می‌گیرند، به‌شکل نادرستی به هم می‌چسبند و هم‌پوشانی (Overlap) بیش از حدی پیدا می‌کنند. این هم‌پوشانی باعث می‌شود که متن به‌هم‌ریخته و دارای اشکالات بصری زیادی به نظر برسد.

گلیف کشیده

هم‌پوشانی حروف

یکی از توسعه‌دهندگان (Jonathan Clark) با بررسی مشکل به این نتیجه رسیده است که این هم‌پوشانی به‌دلیل قرارگیری نادرست گلیف‌های کشیده (Kashida Glyphs) اتفاق می‌افتد.
کشیده نوعی اتصال افقی در حروف فارسی و عربی است که برای تراز کردن خطوط استفاده می‌شود و کارکرد آن پر کردن فضای خالی بین کلمات یا حروف در یک سطر، بدون اضافه کردن فضای سفید (White-space) زیاد است. به‌بیانی دیگر به جای اینکه فاصلهٔ بین کلمات زیاد شود، حروف به‌طور خودکار کشیده می‌شوند.