]> git.eshelyaron.com Git - emacs.git/commitdiff
Fix behavior of string-mark-left-to-right.
authorChong Yidong <cyd@stupidchicken.com>
Fri, 12 Aug 2011 15:43:30 +0000 (11:43 -0400)
committerChong Yidong <cyd@stupidchicken.com>
Fri, 12 Aug 2011 15:43:30 +0000 (11:43 -0400)
* lisp/subr.el (string-mark-left-to-right): Search the entire string
for RTL script, not just the terminating character.  Doc fix.

etc/NEWS
lisp/ChangeLog
lisp/subr.el

index 6f8c125f7f97d6b4f8e432c8f7945e1017384857..1a788e7f6f911b664c40c21dd937231e59b5118e 100644 (file)
--- a/etc/NEWS
+++ b/etc/NEWS
@@ -1038,11 +1038,15 @@ of function value which looks like (closure ENV ARGS &rest BODY).
 *** New function `special-variable-p' to check whether a variable is
 declared as dynamically bound.
 
-** New function `string-mark-left-to-right' appends a Unicode LRM
-(left-to-right mark) character to a string if it terminates in
-right-to-left script.  This is useful when the buffer has overall
-left-to-right paragraph direction and you need to insert a string
-whose contents (and directionality) are not known in advance.
+** New function `string-mark-left-to-right'.
+Given a string containing right-to-left (RTL) script, this function
+returns another string with a terminating LRM (left-to-right mark)
+character.  If this string is inserted into a buffer, Emacs treats the
+LRM as the end of an RTL segment and displays following text as LTR.
+
+This is useful when the buffer has overall left-to-right (LTR)
+paragraph direction and you need to insert a string whose contents
+(and hence directionality) are not known in advance.
 
 ** pre/post-command-hook are not reset to nil upon error.
 Instead, the offending function is removed.
index bde9d54cfa24b925e4fd67cae155e9f2b6ea20e3..b9cf5367bf0157f561dbac4d91fe7d13ef5c37f3 100644 (file)
@@ -1,3 +1,8 @@
+2011-08-12  Chong Yidong  <cyd@stupidchicken.com>
+
+       * subr.el (string-mark-left-to-right): Search the entire string
+       for RTL script, not just the terminating character.  Doc fix.
+
 2011-08-12  Stefan Monnier  <monnier@iro.umontreal.ca>
 
        * progmodes/js.el (js-syntax-propertize, js-syntax-propertize-regexp):
index a897da1d9ba38e555a91ea28ef6cf15ea80ba545..a4251b6fee6c78452cb9700810bb8eb797b66657 100644 (file)
@@ -3540,18 +3540,29 @@ to case differences."
                          str2 0 (length str1) ignore-case)))
 
 (defun string-mark-left-to-right (str)
-  "Return a string that can be safely embedded in left-to-right text.
-If STR ends in right-to-left (RTL) script, return a string
-consisting of STR followed by an invisible left-to-right
-mark (LRM) character.  Otherwise, return STR."
+  "Return a string that can be safely inserted in left-to-right text.
+If STR contains right-to-left (RTL) script, return a string
+consisting of STR followed by a terminating invisible
+left-to-right mark (LRM) character.
+
+The LRM character marks the end of an RTL segment, and resets the
+display direction of any subsequent text to left-to-right.
+\(Otherwise, some of that text might be displayed as part of the
+RTL segment, based on the bidirectional display algorithm.)
+
+If STR contains no RTL characters, return STR."
   (unless (stringp str)
     (signal 'wrong-type-argument (list 'stringp str)))
-  (if (and (> (length str) 0)
-          (eq (get-char-code-property (aref str (1- (length str)))
-                                      'bidi-class)
-              'R))
-      (concat str (propertize (string ?\x200e) 'invisible t))
-    str))
+  (let ((len (length str))
+       (n 0)
+       rtl-found)
+    (while (and (not rtl-found) (< n len))
+      (setq rtl-found (memq (get-char-code-property
+                            (aref str n) 'bidi-class) '(R AL RLO))
+           n (1+ n)))
+    (if rtl-found
+       (concat str (propertize (string ?\x200e) 'invisible t))
+      str)))
 \f
 ;;;; invisibility specs