I&#39;m trying to create a markup recipe which takes some transliterated text and transforms<br>it into Unicode characters according to a set of regular expression rules. (This is useful<br>for languages that are easy to enter as transliterated text, such as Indic or Indian languages).<br>
<br>For example, I have the rule:<br><br>&nbsp;&nbsp; Markup(&quot;tamil&quot;,&#39;&lt;split&#39;,&#39;/\\(:t\s(.*?):\\)/se&#39;, &quot;Tamilize(PSS(&#39;$1&#39;))&quot;);<br><br>and Tamilize() uses preg_replace() to transform the text.<br>
<br>The problem is that I&#39;d like to mix this new markup with conventional PmWiki markup to<br>make it easy to enter this text. For example:<br><br>&nbsp;&nbsp; (:t first line<br>&nbsp;&nbsp; -&gt; second line)<br><br>where the &quot;second line&quot; would be indented.<br>
<br>Unfortunately, PmWiki transforms &#39;&gt;&#39; into the html entity &#39;&amp;gt;&#39; before my markup takes effect<br>and the characters &#39;g&#39; and &#39;t&#39; are also transformed, and the markup doesn&#39;t have the intended<br>
effect.<br><br>I&#39;ve tried moving the location to other places in the markup hierarchy, including &#39;_begin&#39;, to no<br>avail.<br><br>Can anyone help here?<br><br>Thanks,<br>Mani<br><br><br><br>