Freitag, 27. Februar 2009

Unicode - Transliteration

1. Unicode - Vowels, Anusvara, Visarga, etc.

UTF-8 encoding table and Unicode characters

1 97 61 a

2 257 0101 ā

3 105 69 i

3h 239 EF ï Hiatus (aï)

4 299 012B ī

4p 299 012B ī3 Pluta
4p 51 33

5 117 75 u

5h 252 FC ü Hiatus (aü)

6 363 016B ū

7 7771 1E5B ṛ

8 7773 1E5D ṝ

9 7735 1E37 ḷ

10 101 65 e

11 97 61 ai
11 105 69

12 111 6F o

13 97 61 au
13 117 75

14 7745 1E41 ṁ Anusvara - Itranslator 2003

15 7747 1E43 ṃ Anusvara

16 7717 1E25 ḥ Visarga

17 61761 F141  Chandra-Bindu - Itranslator 2003

18 109 6D m̐ Chandra-Bindu - TITUS
18 784 0310

19 817 0331 ̱ Anudātta

20 781 030D ̍ Svarita

21 49 31 1̱̍ Short Kampa
21 817 0331
21 781 030D

22 51 33 3̱̍ Long Kampa
22 817 0331
22 781 030D

23 39 27 ' Avagraha

2. Unicode - Consonants

UTF-8 encoding table and Unicode characters

1 107 6B k

2 107 6B kh
2 104 68

3 103 67 g

4 103 67 gh
4 104 68

5 7749 1E45 ṅ

6 99 63 c

7 99 63 ch
7 104 68

8 106 6A j

9 106 6A jh
9 104 68

10 241 F1 ñ

11 7789 1E6D ṭ

12 7789 1E6D ṭh
12 104 68

13 7693 1E0D ḍ

14 7693 1E0D ḍh
14 104 68

15 7751 1E47 ṇ

16 116 74 t

17 116 74 th
17 104 68

18 100 64 d

19 100 64 dh
19 104 68

20 110 6E n

21 112 70 p

22 112 70 ph
22 104 68

23 98 62 b

24 98 62 bh
24 104 68

25 109 6D m

26 121 79 y

27 114 72 r

28 108 6C l

29 118 76 v

30 347 015B ś

31 7779 1E63 ṣ

32 115 73 s

33 104 68 h

34 7735 1E37 ḷ Itranslator 2003

35 7735 1E37 ḷh Itranslator 2003
35 104 68

36 7739 1E3B ḻ

37 7739 1E3B ḻh
37 104 68


3. Chandra-Bindu

Itranslator 2003 is using a non-Unicode compatible Chandra-Bindu (F141) to get with the fonts URW Palladio ITU and Sanskrit 2003:





Dienstag, 24. Februar 2009

Unicode - Devanagari


1. Unicode does not allow Visarga H after Svaras (Vedic accents)
2. Unicode does not allow Svaras (Vedic accents) after numbers

Itrans:  ta\'H    ta\_H    3\_\'    1\_\'

which results in:

Unicode: त॑ः त॒ः ३॒॑ १॒॑

Itranslator 2003 is using Non-Unicode-compatible Visarga and Svaras to get:

Sanskrit 2003: त॑   त॒   ३   १


Other fonts may not support this feature and show:

Unicode: त॑ त॒ ३ १


3. Unicode and ITRANSLATOR 2003 do not support .NH (Chandra-Bindu followed by Visarga)

nR^I.NH (RV 1.121.1 and RV 8.84.3)

नॄँः

svata\’vA.NH (RV 4.2.6)

स्वत॑वाँः

4. Unicode and ITRANSLATOR 2003 do not support 1\_\'H and 3\_\'H (Kampa followed by Visarga)

su\_bhva1\_\'H svA (RV 1.52.4)

सु॒भ्व१॒॑ः स्वा (Unicode)
सु॒भ्व१ः स्वा (Itranslator 2003)

vishvai\'rvI\_ryai\_3\_\'H patya\'mAna u\_bhe (RV 3.54.15)

विश्वै॑र्वी॒र्यै॒३॒॑ः पत्य॑मान उ॒भे (Unicode)
विश्वै॑र्वी॒र्यै॒३ः पत्य॑मान उ॒भे (Itranslator 2003)

5. Unicode Devanagari

1 2304 0900 ऀ
2 2305 0901 ँ
3 2306 0902 ं
4 2307 0903 ः
5 2308 0904 ऄ
6 2309 0905 अ
7 2310 0906 आ
8 2311 0907 इ
9 2312 0908 ई
10 2313 0909 उ
11 2314 090A ऊ
12 2315 090B ऋ
13 2316 090C ऌ
14 2317 090D ऍ
15 2318 090E ऎ
16 2319 090F ए
17 2320 0910 ऐ
18 2321 0911 ऑ
19 2322 0912 ऒ
20 2323 0913 ओ
21 2324 0914 औ
22 2325 0915 क
23 2326 0916 ख
24 2327 0917 ग
25 2328 0918 घ
26 2329 0919 ङ
27 2330 091A च
28 2331 091B छ
29 2332 091C ज
30 2333 091D झ
31 2334 091E ञ
32 2335 091F ट
33 2336 0920 ठ
34 2337 0921 ड
35 2338 0922 ढ
36 2339 0923 ण
37 2340 0924 त
38 2341 0925 थ
39 2342 0926 द
40 2343 0927 ध
41 2344 0928 न
42 2345 0929 ऩ
43 2346 092A प
44 2347 092B फ
45 2348 092C ब
46 2349 092D भ
47 2350 092E म
48 2351 092F य
49 2352 0930 र
50 2353 0931 ऱ
51 2354 0932 ल
52 2355 0933 ळ
53 2356 0934 ऴ
54 2357 0935 व
55 2358 0936 श
56 2359 0937 ष
57 2360 0938 स
58 2361 0939 ह
59 2362 093A ऺ
60 2363 093B ऻ
61 2364 093C ़
62 2365 093D ऽ
63 2366 093E ा
64 2367 093F ि
65 2368 0940 ी
66 2369 0941 ु
67 2370 0942 ू
68 2371 0943 ृ
69 2372 0944 ॄ
70 2373 0945 ॅ
71 2374 0946 ॆ
72 2375 0947 े
73 2376 0948 ै
74 2377 0949 ॉ
75 2378 094A ॊ
76 2379 094B ो
77 2380 094C ौ
78 2381 094D ्
79 2382 094E ॎ
80 2383 094F ॏ
81 2384 0950 ॐ
82 2385 0951 ॑
83 2386 0952 ॒
84 2387 0953 ॓
85 2388 0954 ॔
86 2389 0955 ॕ
87 2390 0956 ॖ
88 2391 0957 ॗ
89 2392 0958 क़
90 2393 0959 ख़
91 2394 095A ग़
92 2395 095B ज़
93 2396 095C ड़
94 2397 095D ढ़
95 2398 095E फ़
96 2399 095F य़
97 2400 0960 ॠ
98 2401 0961 ॡ
99 2402 0962 ॢ
100 2403 0963 ॣ
101 2404 0964 ।
102 2405 0965 ॥
103 2406 0966 ०
104 2407 0967 १
105 2408 0968 २
106 2409 0969 ३
107 2410 096A ४
108 2411 096B ५
109 2412 096C ६
110 2413 096D ७
111 2414 096E ८
112 2415 096F ९
113 2416 0970 ॰
114 2417 0971 ॱ
115 2418 0972 ॲ
116 2419 0973 ॳ
117 2420 0974 ॴ
118 2421 0975 ॵ
119 2422 0976 ॶ
120 2423 0977 ॷ
121 2424 0978 ॸ
122 2425 0979 ॹ
123 2426 097A ॺ
124 2427 097B ॻ
125 2428 097C ॼ
126 2429 097D ॽ
127 2430 097E ॾ
128 2431 097F ॿ