linuxawy

Question = 2 ( B || !B )

Ideas.. I've seen people kill in the name of them... and die defending them. We are told to remember the idea, not the man. Because a man can fail. He can be caught, he can be killed and forgotten. But several years later... his idea can still change the world.
Go meedan go: Meedan Releases the World's First Open Access Arabic/English Translation Memory

For those who don't know, meedan is a project that I have been watching since I first knew about it from the presentation made be Anas Tawileh in the first meeting in the arab techies.

This project as I understand it, is 2 things, the frontend is a portal for building a bridge between the east and the west by making the discussions available in dual language interface (arabic + english). The backend and the second purpose of this project is so awesome. This translation is made by an automatic translation bot, with human translators to fix and give feedback to the automatic translator to make it learn.

This way the translation bot learns in a very speedy way compared with other translation engines like google translate. The awesome part that was planned since day 1 and is announced now: The translation memory is to be available in open format. Yes, just the contrary of google's strategy. Google keeps you working free for it and give feedback to the translation bot, and they keep the translation memory in propriatory format (I will write a full blog entry about 'google's behaviour' later).

But meedan is on the other side, making effort in its translation memory, then it opens it in an open format so people can use it in other projects for free. Currently it's available for download on github.

I'll leave you now with their press release:
-----------------------------------
5 November, 2009: San Francisco, United States and Toronto, Canada

Today, Meedan, is releasing the first publicly available open licensed Arabic/English Translation Memory (TM). This release comes as a part of Meedan's ongoing commitment to improving the state of Arabic language machine processing research and supporting translators and machine translation researchers.

The new translation memory, called MeedanMemory, contains around one million words in aligned Arabic and English sentence pairs. It constitutes an invaluable resource for translation professionals, Arabic linguistic researchers, academics and volunteer communities, and is the first translation memory of such size and sophistication to be released under an open access license.

MeedanMemory is packaged as a standards-compliant Translation Memory Exchange (TMX) file, which facilitates its integration with most computer assisted translation tools and translation memory managers.

Professional translators can utilize MeedanMemory to support their translation work and improving its efficiency, and to increase consistency and quality in the translation outcome. Researchers can use this resource in designing and implementing their research activities into Arabic computer linguistics and machine language processing, which will lead to the development of better text search engines and document analysis tools and applications. And community organizations, non-profits and volunteer communities can leverage MeedanMemory to facilitate translation between Arabic and English of the content they produce for lower costs, lower turnaround times and higher quality.

The MeedanMemory is released under the Open Database License, which permits the use, copy and distribution of the translation memory, produce work using it, and to modify, transform and build upon the translation memory.

Meedan is pleased to announce this first release of MeedanMemory, and will continue to release data generated from the Meedan translation community into this open repository. We also hope that other organizations will contribute to the growth of this unique and valuable resource for the Arabic language and Arabic digital content that holds great potential for supporting Arabic content projects and initiatives.

To download your copy of MeedanMemory, please visit: http://github.com/anastaw/Meedan-Memory

For more information about MeedanMemory, please contact: [email protected]

Meedan Cross-language Arabic-English Social Networking: beta.meedan.net

About Meedan:

Meedan (Arabic for ‘town square') is a social media and technology non-profit. Our mission is to promote the exchange of knowledge, media, and conversations across linguistic and cultural divides, with an initial focus on Arabic-English collaborations. We serve end-users interested in media exchange through our public-facing http://beta.meedan.net site, and we provide a social networking, knowledge exchange, and web-based translation platform to a network of NGO partners. The Meedan project was incorporated as a non-profit organization in 2006. Based in San Francisco, our distributed team of Meedanis contribute engineering, design, and translation services to our project from Cairo, Damascus, London, Beirut, the West Bank, Doha, Gaza, Jeddah, Rabat, Amman, Toronto, and Portland.

Meedan is a leading advocate for open linguistic data and open source tools and is innovating approaches to social translation, data aggregation, data visualization, and tagging in the context of Arab Region use cases.

نشرة إعلامية

ميدان تطلق أول ذاكرة ترجمة مفتوحة المصدر للغتين العربية والإنكليزية

6 تشرين الثاني: سان فرانسيسكو، الولايات المتحدة وتورونتو، كندا

تطلق ميدان اليوم أول ذاكرة ترجمة مفتوحة المصدر للغتين العربية والإنكليزية، ويأتي هذا الحدث تجسيداً لالتزام ميدان المستمر بتطوير أبحاث المعالجة الآلية للغة العربية ودعم المترجمين والباحثين في مجال الترجمة الآلية.

تحتوي ذاكرة الترجمة الجديدة والتي سميت (ذاكرة ميدان) ما يقارب المليون كلمة، مرتبة ضمن أزواج من الجمل المترجمة بين العربية والإنكليزية. وتوفر هذا الذاكرة مصدراً قيماً للمترجمين المحترفين والباحثين في مجال اللغويات العربية ومجتمعات المتطوعين، كما تعتبر أول ذاكرة ترجمة بهذا الحجم والتطور يتم إطلاقها ضمن إتفاقية ترخيص مفتوحة.

يمكن الحصول على ذاكرة ميدان بصيغة ملف متوافق مع معايير Translation Memory Exchange (TMX) مما يسهل تضمينها في معظم أدوات الترجمة بمعونة الحاسب أو أدوات إدارة ذاكرة الترجمة.

يمكن للمترجمين المحترفين استثمار ذاكرة ميدان لدعم عملهم في الترجمة وتحسين أدائه، بالإضافة إلى زيادة مستوى الإتساق والجودة لنتاج ترجمتهم. كما يمكن للباحثين أيضاً الإعتماد على هذا المورد أثناء تصميم وتنفيذ أنشطتهم البحثية في مجالات حوسبة اللغة العربية والمعالجة الآلية للغة العربية، مما سيتمخض بدوره عن تطوير جيل جديد من محركات البحث وأدوات وتطبيقات تحليل ومعالجة النصوص والوثائق يتميز بقدرته على التعامل بكفاءة مع خصوصيات اللغة العربية. كما يمكن للجمعيات الأهلية وغير الربحية وتجمعات المتطوعين الاعتماد على ذاكرة ميدان لتسهيل عملية الترجمة بين اللغتين العربية والإنكليزية لما ينتجوه من محتوى بكلفة أقل وزمن أقصر وجودة أعلى.

أطلقت ذاكرة ميدان ضمن إتفاقية ترخيص قواعد البيانات المفتوحة والتي تتيح للمستخدم إستثمار ونسخ وتوزيع هذه الذاكرة واستخدامها في إنتاج أية أعمال وتعديلها وتحويرها والبناء عليها.

يسر ميدان اليوم أن تعلن عن إطلاق هذا الإصدار الأول من ذاكرة ميدان، والتي سيليها المزيد من إصدار البيانات التي يعمل مجتمع الترجمة في ميدان على إنتاجها وإتاحتها ضمن هذا المورد المفتوح. كما نأمل أن تنضم إلينا المؤسسات والمنظمات الأخرى المهتمة بهذا الموضوع في إغناء وتنمية هذا المورد الفريد والقيم لخدمة اللغة العربية والمحتوى الرقمي العربي، والذي يعد بالدعم الوفير لمشاريع ومبادرات المحتوى العربي.

يمكن الحصول على ذاكرة ميدان من الموقع التالي: http://github.com/anastaw/Meedan-Memory

للمزيد من المعلومات عن ذاكرة ميدان، يرجى الإتصال بعنوان البريد الإلكتروني التالي: [email protected]

الموقع الإلكتروني لشبكة ميدان الإجتماعية العابرة للغات: beta.meedan.net

عن ميدان

ميدان (وتعني بالعربية "ساحة البلدة") هي مؤسسة غير ربحية تهدف إلى نشجيع تبادل المعرفة والمحادثات عبر الحواجز اللغوية والثقافية، وتركز حالياً على اللغتين العربية والإنكليزية. تقوم ميدان بتخديم مستخدمي الإنترنت المهتمين بتبادل الآراء والأفكار من خلال موقعنا beta.meedan.net، كما توفر منصات للتشبيك الإجتماعي وتبادل المعرفة والترجمة التشاركية لشبكة من شركائها. أسست ميدان في العام 2006، ومقرها الرئيسي سان فرانسيسكو. يتوزع فريق عمل ميدان (والذي يطلقون على أنفسهم لقب "ميدانيين") للهندسة والتصميم والترجمة فيما بين القاهرة ودمشق ولندن وبيروت والضفة الغبية وقطاع غزة وجدة والرباط وعمان وتورونتو وبورتلاند.

تعتبر ميدان أحد رواد حركة البيانات اللغوية المفتوحة وأدوات المصادر المفتوحة وتعمل جاهدة على تطوير أساليب مبتكرة للترجمة التشاركية وتجميع وتصنيف البيانات وتمثيلها بيانياً في سياق استخدام شبكة الإنترنت في العالم العربي.

Thank you

Thank you very much Ahmed,

I really hope that this modest step will be followed by others so that we can all contribute to the development of an invaluable resource for the Arabic language.

Salam,
Anas

you are welcomed

you are doing really great job in this project, keep up the good work. I hope I can help this project with anything even with a blog post. But tell me, what's the part is being made in cairo?

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

Thanks

Thanks, Ahmed. You are a great spokesperson!! I am going to quote you on the comparison to Google. Look forward to meeting you at IGF!!

Salam,
Ed

Thanks Ed

Thanks Ed for the comment, of course you can quote anything you want, this site is under FDL :)

I'm sorry I couldn't make it to the IGF, I hope I can see you soon.

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

Comment viewing options

Select your preferred way to display the comments and click "Save settings" to activate your changes.

Post new comment

The content of this field is kept private and will not be shown publicly.
CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
minus seven equals one
Solve this math question and enter the solution with digits. E.g. for "two plus four = ?" enter "6".
Delicious Bookmarks