اوكى
بصراحه نفسى اقول كلام كتير لانى فى حالة من الضيق لا يتخيلها احد
المهم
ده ملف قاموس للمدقق الاملائى aspell انا عملته من نص القران الكريم
فك ضغط الملف فى "/usr/lib/aspell" او دور بنفسك aspell بيدور على القواميس فى انهى داهيه و لو ما عرفتش ولع فى نفسك و بطل تستخدم لينوكس يا حمار
كان هدفى ان اعمل قاموس عربى ل aspell علشان نتنيل نعرف نعمل تدقيق املائى للعربى "و الله نفسى اشتم بجد" لان ى اكتشفت ان بغداد مش هاينفع و هابقى اكتب بوست ليه مش هاينفع
اللى طلعها فى دماغى انى اقوم و اعملها رغم انى كنت ناوى ماعملهاش "لانى محبط من ال community العربى" اسلام.
المهم جبت كلمات المصحف كلها و عملت منها قاموس بس خد بالك لو هاتستعمله ان فيه كلمات كتير غلط هايعديها و يقول عليها صح علشان الرسم العثمانى بتاع المصحف
عمرو غربية وعدنى انى هايبعتلى ملفات صح و هاعمل منها قاموس ينفع للعربى المعاصر
و علشان كده انا مش هادى للناس ال ملفات الاصليه اللى عملت منها القاموس و اللى مش عاجبه يخبط دماغه فى الحيط
و مش عايز اى حد يسالنى على الداتا لانى مش هاديها لحد. اسف
يا رب نفسى اتخانق مع حد










أنا عملت word list من ملفات الداتا بتاعت بغداد (سكريبت عبيط طلع كل الكلمات العربى ورتبها أبجدى) بس كل المحاولات لعمل قاموس aspell منها منفعيتش وعمال يطلعلى أخطاء عن unsupported أو invalid charachter حتى لما خليته يتجاهل الأخطاء طلعلى قاموس ممنوش فايده ولما عملتله dump طلعلى كلمات مش عارفلها encoding
ممكن تقوللى ال ar.dat بتاعك عامل ازاى أو ازاى عملت القاموس بتاعك
وبعدين مستخدمتش الداتا بتاعت بغداد ليه ؟
علشان فيها غلطات و كلمات قديمة و ماحدش عارف اد ايه
ممكن تبعتلى السكربت ؟
عشان مبقاش كداب السكريبت أنا خدته من هنا http://cltb.net/ar/bash.html#10 (تانى واحد )
وتعديل بسيط عليه بقى حاجة زى كده
#!/bin/shrm /tmp/glassory.txt.tmp 2>/dev/null
for i in "$@"
do
echo -n "processing [$i] ... "
cat $i | sed -e "s/[0-9A-Za-z\\\/\-\(\)\"\'\`\~\,]/+/g" |
tr A-Z a-z | tr -s "+" "\012" |
sed -e "s/^[0-9\\\/ ]*//g" >> /tmp/wordlist.tmp
echo " OK "
done
echo -n "sorting ... "
cat /tmp/wordlist.tmp | sort | uniq > ./wordlist
rm /tmp/wordlist.tmp
echo "done!"
وبالمناسبة القاموس اللى عملته منها نفع دلوقتى وشغال بس مجربتوش كويس
اعتقد السكربت ده مش هاينفع لان قاعدة بيانات بغداد مش سهله كده
لو عايز شرح اكتر اقولك تقرا فين
أنا معرفش وجهة نظرك ايه بس انا عملت قاموس شغال نص نص (نص الكلمات بيطلعها غلط يعنى مالوش لازمة)
وياريت تقولى اقرى فين (انا قريت ال info بتاعت aspell بس مأسعفتنيش أوى)
وبعدين أنا شاكك أن aspell هيشتغل كويس مع العربى , انت فلهم الفرق بين العربى والإنجليزى بس نحاول
وعلى فكرة القاموس بتاعك بيكراش aspell لما بشغله مع ملف عربى-انجليزى (حتى كتوب عمل كراش منها)
طب انا هاوصفلك الداتا بتاعة بغداد و دؤلى بس بالعنجليزى معلش بقه ;-)
The database is composed of 6 tables:
1) prefixes
2) suffixes
3) stems
plus three other compatibility tables
4) valid prefixes-stems
5) valid stems-suffixes
6) valid prefixes-stems
so in order for a word to be valid it must be broken to a stem + a prefix + a suffix and all three of them must be in the corresponding tables and they must be compatible paer the tables 4,5,6
الناس بتوع aspell بيقولوا انه هايشتغل و انا جربت بنفسى و اشتغل
بالنسبه للكراش فكتوب اللى معاك مش هايخلى aspell يدقق العربى
استعمل ال CVS احسن
cvs -z3 -d:pserver:anonymous@home.foolab.org:/var/lib/cvs co projects/katoob
ممكن تبعتلى الملف اللى عمل كراش ؟ لو عرفت اخليه يعمل كراش اقدر اصلح ال bug
هحاول ابعتلك الملف (أنا مش فى البيت)
بس الكراش من aspell مش من كتوب, وأنا جربته مع القاموس اللى عامله محصلش كراش.
وبالنسبة لكتوب أنا لاحظت انه مش بيدقق العربى بس بسيت أقول
و الله العظيم إني من أيام أقول إن الكميونتي العربي مقصر كثير في كثير من النواحي على الإنترنت و أنه أدور للمره الألف عن لستات كلمات عربية. و الحمدالله إني طلعت قلطان
المهم إني من سنه و أنا أدور على قاموس عربي أو لستة كلمات علشان أظمه لل Aspell و ما لقيت إلا لستات بلغات ثانيه
العرب إنشاالله فيهم الخير بس المشكله في تشتت المصادر على الإنترنت و البحث عنها مش سهل مثل اللغة الإنجليزية
و أخيرا اشكرك أخي كثيرا على هذا المجهود العظيم و الذي أدعو الله أن يضعه في ميزان حسناتك
العرب ولاد كلب و امحدش فيهم عمل ولا بيعمل ولا هايعمل حاجه
انا اهو و انت اهو و كلمتى اهى
لو الموقف ده اتغير ابقى تف على قبرى
اسف بس دى الحقيقه
و شكرا على دعواتك
الصبر يا طيب
قد يكون بعض العرب مثل ما قلت، لكن التعميم أكيد حيدخل بينا في دوائر لا فائدة منها.
المهم، ليس كل العرب على دراية وخبرة مثلك في اللينوكس (على قد حالنا - سامحنا) لكننا مهتمون بمدقق عربي مجاني.
لو كان طلبك تدقيق وتصحيح الكلمات العربية، فأنا لها، فقط أرسل لي ملفات للتدقيق، وبمشيئة الله أردها لك كما أرها، ولربما استعنت ببعض الأصدقاء
مع دعواتي لكم جميعاً بالتوفيق
salam,
Hi, i am a software Eng. in Sunmicro systems CZ,i need a real good spell checker for AR, can u help me? plz.....
I don't know about any. Sorry.
Ask on Arabeyes.org