مدتی پیش نسخهٔ جدیدی از بانک کلمات غلط فارسی را در اختیار توسعهدهندگان لیبرهآفیس گذاشتم.
امروز و همزمان با انتشار لیبرهآفیس ۲۵.۸.۱ کلمات اضافهشده هم در لیبرهآفیس قرار گرفتند.
علاوه بر کلماتِ جدید چندین کلمه را هم که به رسمالخط مرتبط بودند و غلط املایی قلمداد نمیشدند از بانک حذف کردم.
با توجه به اصلاحاتِ صورتگرفته میشود گفت که الان این بانک در وضعیت کموبیش بهینهای قرار گرفته است.
نیمفاصلههای کاذب
یکی از چالشهای متون فارسی وجود نیمفاصلههای کاذب است. ظاهری شبیه به نیمفاصله دارند، اما در حقیقت نویسههای دیگری هستند.
این نویسهها خصوصاً وقتی از یک سند به سند دیگری کپی میشوند، میتوانند باعث نمایش نادرست متن، بههمریختگی خطوط و مشکلاتی در جستوجوی محتوا شوند.
در واژهپرداز لیبرهآفیس با کمک عبارتهای باقاعده میشود همهٔ آنها را یافت، اما استفاده از آن زحمتهای خاص خودش را دارد. بنابراین با کمک هوش مصنوعی یک ماکروی پایتون ساختم که همان کار را بیدردسر و بدون خطا انجام بدهد.
این ماکرو همهٔ نیمفاصلههای کاذب (که ۷ تا هستند) را پیدا و اصلاحشان میکند. در پایان کارش هم یک گزارش از نتیجهٔ اصلاحاتش میدهد.
1. Soft Hyphen (SHY) ← کد یونیکد: U+00AD
2. Not Sign ← کد یونیکد: U+00AC
3. Right-to-Left Mark (RLM) ← کد یونیکد: U+200F
4. Four-Per-Em Space ← کد یونیکد: U+2005
5. Zero Width No-Break Space (BOM, ZWNBSP) ← کد یونیکد: U+FEFF
6. Zero Width Space (ZWSP) ← کد یونیکد: U+200B
7. Zero Width Joiner (ZWJ) ← کد یونیکد: U+200D
لیبره آفیس 25.8 منتشر شد
بنیاد مستندات (TDF) انتشار لیبره آفیس نسخه 25.8 با ویژگیهای جدید و تعداد زیادی رفع اشکال را اعلام کرد. لیبره آفیس برای ویندوز (پردازنده های اینتل و آرم)، macOS (پردازندههای اپل سیلیکون و اینتل) و لینوکس (اینتل در قالب DEB و RPM) عرضه میشود که شما میتوانید متناسب با رایانه خودتان آن را از آدرس دانلود همیشگی لیبره آفیس دریافت و نصب کنید:
https://www.libreoffice.org/download/
برای دیدن ویژگیهای جدید لیبره آفیس 25.8 که از شمارهگذاری جدید مبتنی بر سال و ماه میلادی استفاده میکند، به آدرس زیر مراجعه کنید:
https://wiki.documentfoundation.org/ReleaseNotes/25.8
در این نسخه نیز اشکالات مهمی مرتبط با خط و زبان فارسی حل شده است. برای استفاده از خروجی بهبود یافته، پیشنهاد میکنم نسخه 25.8 را دانلود و نصب کنید.
سند فارسی و قفل شدن لیبرهآفیس
ظاهراً و بر اساس این گزارش در نسخهٔ در حال توسعهٔ لیبرهآفیس اگر سندی فارسی باشد و قالب (فرمت) فایل هم DOC باشد، لیبرهآفیس در زمان باز کردن سند قفل میکند و عملاً نمیشود از آن استفاده کرد.
مشکل کوچکی نیست، اما خوشبختانه برطرف شده و در نسخهٔ 25.8 لیبرهآفیس وجود نخواهد داشت.
دردسرهای تراز
وقتی در برنامهای مثل لیبرهآفیس متنی به فارسی یا عربی مینویسید، چنانکه میدانید این زبانها از راست به چپ نوشته میشوند. اما گاهی اوقات لازم است که یک قسمت از متن مثلاً یک جملهٔ انگلیسی یا اعداد و فرمولهای خاص را از چپ به راست بنویسید. این کار را میتوانید با تغییر جهت نوشته انجام دهید.
در اینجا متأسفانه مشکلی وجود دارد: وقتی قسمتی از یک سند فارسی را تنظیم میکنید که به صورت چپ به راست نمایش داده شود و در عین حال میخواهید که متن کاملاً مرتب و صاف در دو طرف صفحه قرار بگیرد (یعنی مثل روزنامهها، از هر دو طرف چپ و راست به خطوط فرضی حاشیه بچسبد)، لیبرهآفیس قاتی میکند!
به زبان ساده، نرمافزار نمیتواند درست حساب و کتاب کند که هر کلمه و حرف چقدر فضا نیاز دارد تا هم از چپ به راست نمایش داده شود و هم دو طرفش صاف باشد. نتیجهاش این میشود که قسمتی از متن از حاشیهٔ صفحه بیرون میزند و دیگر دیده نمیشود یا اینکه ظاهر سندتان را خراب میکند.
این مشکل در اینجا گزارش شده است و امیدواریم تا پیش از انتشار نسخهٔ پایدار بعدی برطرف بشود.
دانمارک و لیبرهآفیس
دولت دانمارک تصمیم گرفته است که بهتدریج محصولات مایکروسافت را کنار بگذارد و بهجای آنها از نرمافزارهای متنباز استفاده کند. دلیل اصلی این اقدام افزایش حاکمیت دیجیتال کشور است.
بر اساس این تصمیم نزدیک به نیمی از کارمندان وزارت امور دیجیتال دانمارک، سیستمعامل خود را از ویندوز به لینوکس و مجموعهنرمافزاری اداری خود را از آفیس ۳۶۵ به لیبرهآفیس تغییر خواهند داد.
این حرکت بخشی از استراتژی دیجیتالی شدن دولت دانمارک است و هدف آن کنترل بیشتر بر زیرساختها و دادههای دیجیتال است. با وجود اینکه ممکن است مشکلاتی در این مسیر پیش بیاید و بهطور موقت نیاز به بازگشت به محصولات مایکروسافت باشد، اما دولت قاطعانه قصد دارد وابستگی خود را به شرکتهای بزرگ فناوری کاهش دهد.
حل شدن مشکل همپوشانی حروف فارسی
لیبرهآفیس ۲۵.۲.۴ امروز منتشر شد. آنچه در این نسخه برای ما بهعنوان یک کاربر فارسیزبان اهمیت دارد حل شدن مشکل (باگ) همپوشانی حروف فارسی در جعبههای متنی است.
مشکل این بود که حروف فارسی وقتی در یک جعبهٔ متنی (Text Box) به صورت تراز شده (Justified) قرار میگیرند، بهشکل نادرستی به هم میچسبند و همپوشانی (Overlap) بیش از حدی پیدا میکنند. این همپوشانی باعث میشود که متن بههمریخته و دارای اشکالات بصری زیادی به نظر برسد.
یکی از توسعهدهندگان (Jonathan Clark) با بررسی مشکل به این نتیجه رسیده است که این همپوشانی بهدلیل قرارگیری نادرست گلیفهای کشیده (Kashida Glyphs) اتفاق میافتد.
کشیده نوعی اتصال افقی در حروف فارسی و عربی است که برای تراز کردن خطوط استفاده میشود و کارکرد آن پر کردن فضای خالی بین کلمات یا حروف در یک سطر، بدون اضافه کردن فضای سفید (White-space) زیاد است. بهبیانی دیگر به جای اینکه فاصلهٔ بین کلمات زیاد شود، حروف بهطور خودکار کشیده میشوند.