မော်ဂျူး:scripts/data

Documentation for this module may be created at မော်ဂျူး:scripts/data/doc
--[=[
	When adding new scripts to this file, please don't forget to add
	style definitons for the script in [[မီဒီယာဝီခီ:Common.css]].
]=]

local u = mw.ustring.char
local m = {}
local u = mw.ustring.char

m["Adlm"] = {
	canonicalName = "Adlam",
	characters = "؟ـ𞤀-𞥟",
	capitalized = true,
	direction = "rtl",
}

m["Afak"] = {
	canonicalName = "Afaka",
}

m["Aghb"] = {
	canonicalName = "Caucasian Albanian",
	characters = "𐔰-𐕯",
}

m["Ahom"] = {
	canonicalName = "Ahom",
	characters = "𑜀-𑝏",
	systems = {"abugida"},
}

m["Arab"] = {
	canonicalName = "Arabic",
	varieties = {"Jawi", {"Nastaliq", "Nastaleeq"}},
	characters = "؀-ۿݐ-ݿࡰ-ࣿﭐ-﷏ﷰ-﷿ﹰ-﻾𐋠-𐋻𐹠-𐹿𐻀-𐻿𞸀-𞻿",
	direction = "rtl",
	systems = {"abjad"},	-- more precisely, impure abjad
	normalizationFixes = {
		from = {"ٳ"},
		to = {"اٟ"}
	},
}

	m["fa-Arab"] = {
		canonicalName = "Arabic",
		otherNames = {"Perso-Arabic"},
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["kk-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["ks-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["ku-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["ms-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["mzn-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["ota-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["pa-Arab"] = {
		canonicalName = "Shahmukhi",
		otherNames = {"Arabic"},
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["ps-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["sd-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["tt-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["ug-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["ur-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

	m["xka-Arab"] = {
		canonicalName = "Arabic",
		characters = m["Arab"].characters,
		direction = "rtl",
		parent = "Arab",
		normalizationFixes = m["Arab"].normalizationFixes,
	}

-- Aran (Nastaliq) is subsumed into Arab

m["Armi"] = {
	canonicalName = "Imperial Aramaic",
	characters = "𐡀-𐡟",
	direction = "rtl",
	systems = {"abjad"},
}

m["Armn"] = {
	canonicalName = "Armenian",
	characters = "԰-֏ﬓ-ﬗ",
	capitalized = true,
	systems = {"alphabet"},
}

m["Avst"] = {
	canonicalName = "Avestan",
	characters = "𐬀-𐬿",
	direction = "rtl",
}

	m["pal-Avst"] = {
		canonicalName = "Pazend",
		characters = m["Avst"].characters,
		direction = "rtl",
		parent = "Avst",
	}

m["Bali"] = {
	canonicalName = "Balinese",
	characters = "ᬀ-᭿",
	systems = {"abugida"},
}

m["Bamu"] = {
	canonicalName = "Bamum",
	characters = "ꚠ-꛿𖠀-𖨿",
}

m["Bass"] = {
	canonicalName = "Bassa",
	aliases = {"Bassa Vah", "Vah"},
	characters = "𖫐-𖫿",
}

m["Batk"] = {
	canonicalName = "Batak",
	characters = "ᯀ-᯿",
	systems = {"abugida"},
}

m["Beng"] = {
	canonicalName = "Bengali",
	characters = "॒॑।॥ঀ-৯৲-৿᳕᳖᳘᳐᳒᳡ᳪ᳭ᳲᳵ-᳷꣱",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"অা", "ঋৃ", "ঌৢ"},
		to = {"আ", "ৠ", "ৡ"}
	},
}

	m["as-Beng"] = {
		canonicalName = "Assamese",
		otherNames = {"Bengali-Assamese", "Eastern Nagari"},
		characters = "॒॑।॥ঀ-য঱-৿᳕᳖᳘᳐᳒᳡ᳪ᳭ᳲᳵ-᳷꣱",
		systems = {"abugida"},
		normalizationFixes = m["Beng"].normalizationFixes,
	}

m["Bhks"] = {
	canonicalName = "Bhaiksuki",
	characters = "𑰀-𑱯",
	systems = {"abugida"},
}

m["Blis"] = {
	canonicalName = "Blissymbols",
	aliases = {"Blissymbolics"},
	systems = {"logography"},
	-- Not in Unicode
}

m["Bopo"] = {
	canonicalName = "Zhuyin",
	aliases = {"Zhuyin Fuhao", "Bopomofo"},
	characters = "ˇˉˊˋ˙˪˫、-〃〈-】〓-〟〪-〭〰〷・㄀-ㄯ﹅﹆｡-･",
}

m["Brah"] = {
	canonicalName = "Brahmi",
	characters = "𑀀-𑁿",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"𑀅𑀸", "𑀋𑀾", "𑀏𑁂"},
		to = {"𑀆", "𑀌", "𑀐"}
	},
}

m["Brai"] = {
	canonicalName = "Braille",
	characters = "⠀-⣿",
}

m["Bugi"] = {
	canonicalName = "Buginese",
	aliases = {"Lontara"},
	characters = "ᨀ-᨟ꧏ",
	systems = {"abugida"},
}

m["Buhd"] = {
	canonicalName = "Buhid",
	characters = "᜵᜶ᝀ-᝟ꧏ",
	systems = {"abugida"},
}

m["Cakm"] = {
	canonicalName = "Chakma",
	characters = "০-৯၀-၉𑄀-𑅏",
	systems = {"abugida"},
}

m["Cans"] = {
	canonicalName = "Canadian syllabics",
	characters = "᐀-ᙿᢰ-᣿𑪰-𑪿",
	systems = {"abugida"},
}

m["Cari"] = {
	canonicalName = "Carian",
	characters = "𐊠-𐋟",
	systems = {"alphabet"},
}

m["Cham"] = {
	canonicalName = "Cham",
	characters = "ꨀ-꩟",
	systems = {"abugida"},
}

m["Cher"] = {
	canonicalName = "Cherokee",
	characters = "Ꭰ-᏿ꭰ-ꮿ",
	systems = {"syllabary"},
}

m["Chrs"] = {
	canonicalName = "Chorasmian",
	characters = "𐾰-𐿟",
	direction = "rtl",
	systems = {"abjad"},
}

m["Copt"] = {
	canonicalName = "Coptic",
	characters = "Ϣ-ϯⲀ-⳿𐋠-𐋻", -- this is mostly "Coptic", not unified "Greek and Coptic"
	capitalized = true,
	systems = {"alphabet"},
}

m["Cpmn"] = {
	canonicalName = "Cypro-Minoan",
	aliases = {"Cypro Minoan"},
	characters = "𐄀𐄁𒾐-𒿿",
	systems = {"syllabary"},
}

m["Cprt"] = {
	canonicalName = "Cypriot",
	characters = "𐄀-𐄂𐄇-𐄳𐄷-𐄿𐠀-𐠿",
	direction = "rtl",
	systems = {"syllabary"},
}

m["Cyrl"] = {
	canonicalName = "Cyrillic",
	characters = "Ѐ-ԯᲀ-᲏ᴫᵸ᷸ⷠ-ⷿ⹃Ꙁ-ꚟ︮︯𞀰-𞂏",
	capitalized = true,
	systems = {"alphabet"},
}

m["Cyrs"] = {
	canonicalName = "Old Cyrillic",
	aliases = {"Early Cyrillic"},
	characters = m["Cyrl"].characters,
	capitalized = m["Cyrl"].capitalized,
	wikipedia_article = "Early Cyrillic alphabet",
	systems = {"alphabet"},
}

m["Deva"] = {
	canonicalName = "Devanagari",
	characters = "ऀ-ॿ꣠-ꣿ𑬀-𑬉",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ॆॆ", "ेे", "ाॅ", "ाॆ", "ाꣿ", "ॊॆ", "ाे", "ाै", "ोे", "ाऺ", "ॖॖ", "अॅ", "अॆ", "अा", "एॅ", "एॆ", "एे", "एꣿ", "ऎॆ", "अॉ", "आॅ", "अॊ", "आॆ", "अो", "आे", "अौ", "आै", "ओे", "अऺ", "अऻ", "आऺ", "अाꣿ", "आꣿ", "ऒॆ", "अॖ", "अॗ", "ॶॖ", "्‍?ा"},
		to = {"ꣿ", "ै", "ॉ", "ॊ", "ॏ", "ॏ", "ो", "ौ", "ौ", "ऻ", "ॗ", "ॲ", "ऄ", "आ", "ऍ", "ऎ", "ऐ", "ꣾ", "ꣾ", "ऑ", "ऑ", "ऒ", "ऒ", "ओ", "ओ", "औ", "औ", "औ", "ॳ", "ॴ", "ॴ", "ॵ", "ॵ", "ॵ", "ॶ", "ॷ", "ॷ"}
	},
}

m["Diak"] = {
	canonicalName = "Dhives Akuru",
	aliases = {"Dives Akuru"},
	characters = "𑤀-𑤆𑤉𑤌-𑤓𑤕𑤖𑤘-𑤵𑤷𑤸𑤻-𑥆𑥐-𑥙",
	systems = {"abugida"},
}

m["Dogr"] = {
	canonicalName = "Dogra",
	characters = "𑠀-𑠻",
	systems = {"abugida"},
}

m["Dsrt"] = {
	canonicalName = "Deseret",
	characters = "𐐀-𐑏",
	capitalized = true,
	systems = {"alphabet"},
}

m["Dupl"] = {
	canonicalName = "Duployan",
	characters = "𛰀-𛱪𛱰-𛱼𛲀-𛲈𛲐-𛲙𛲜-𛲟",
}

m["Egyd"] = {
	canonicalName = "Demotic",
	systems = {"abjad", "logography"},
}

m["Egyh"] = {
    canonicalName = "Hieratic",
    systems = {"abjad", "logography"},
}

m["Egyp"] = {
	canonicalName = "Egyptian hieroglyphic",
	varieties = {"Hieratic"},
	characters = "𓀀-𓑕",
	wikipedia_article = "Egyptian hieroglyphs",
	systems = {"abjad", "logography"},
	normalizationFixes = {
		from = {"𓈗", "𓃁", "𓆖"},
		to = {"𓈖𓐰𓈖𓐰𓈖", "𓃀𓐶𓂝", "𓆓𓐳𓐷𓏏𓐰𓇿𓐸"}
	},
}

m["Elba"] = {
	canonicalName = "Elbasan",
	characters = "𐔀-𐔧",
	systems = {"alphabet"},
}

m["Ethi"] = {
	canonicalName = "Ethiopic",
	aliases = {"Ge'ez"},
	characters = "ሀ-ቈቊ-ቍቐ-ቖቘቚ-ቝበ-ኈኊ-ኍነ-ኰኲ-ኵኸ-ኾዀዂ-ዅወ-ዖዘ-ጐጒ-ጕጘ-ፚ፝-፼ᎀ-᎙ⶀ-ⶖⶠ-ⶦⶨ-ⶮⶰ-ⶶⶸ-ⶾⷀ-ⷆⷈ-ⷎⷐ-ⷖⷘ-ⷞꬁ-ꬆꬉ-ꬎꬑ-ꬖꬠ-ꬦꬨ-ꬮ𞟠-𞟦𞟨-𞟫𞟭𞟮𞟰-𞟾",
	systems = {"abugida"},
}

m["Geok"] = {
	canonicalName = "Khutsuri",
	varieties = {"Nuskhuri", "Asomtavruli"},
	characters = "Ⴀ-ჅჇჍ჻ⴀ-ⴥⴧⴭ", -- Ⴀ-Ⴭ is Asomtavruli, ⴀ-ⴭ is Nuskhuri
	capitalized = true,
	systems = {"alphabet"},
}

m["Geor"] = {
	canonicalName = "Georgian",
	varieties = {"Mkhedruli", "Mtavruli"},
	characters = "ა-ჿᲐ-ᲺᲽ-Ჿ", -- ა-ჿ is lowercase Mkhedruli; Ა-Ჿ is uppercase Mkhedruli (Mtavruli)
	capitalized = true,
	systems = {"alphabet"},
}

m["Glag"] = {
	canonicalName = "Glagolitic",
	characters = "Ⰰ-ⱟ𞀀-𞀆𞀈-𞀘𞀛-𞀡𞀣𞀤𞀦-𞀪",
	capitalized = true,
	systems = {"alphabet"},
}

m["Gong"] = {
	canonicalName = "Gunjala Gondi",
	characters = "𑵠-𑵥𑵧𑵨𑵪-𑶎𑶐𑶑𑶓-𑶘𑶠-𑶩",
	systems = {"abugida"},
}

m["Gonm"] = {
	canonicalName = "Masaram Gondi",
	characters = "𑴀-𑴆𑴈𑴉𑴋-𑴶𑴺𑴼𑴽𑴿-𑵇𑵐-𑵙",
	systems = {"abugida"},
}

m["Goth"] = {
	canonicalName = "Gothic",
	characters = "𐌰-𐍊",
	systems = {"alphabet"},
}

m["Gran"] = {
	canonicalName = "Grantha",
	characters = "𑌀-𑌃𑌅-𑌌𑌏-𑌐𑌓-𑌨𑌪-𑌰𑌲𑌳𑌵-𑌹𑌼-𑍄𑍇𑍈𑍋-𑍍𑍐𑍗𑍝-𑍣𑍦-𑍬𑍰-𑍴",
	systems = {"abugida"},
}

m["Grek"] = {
	canonicalName = "Greek",
	characters = "Ͱ-ͷͺ-Ϳ΄-ΊΌΎ-ΡΣ-ϡϰ-Ͽᴦ-ᴪᵝ-ᵡᵦ-ᵪᶿΩ℩ꭥ𐅀-𐆎𐆠𝈀-𝉅",
	capitalized = true,
	systems = {"alphabet"},
}

	m["polytonic"] = {
		canonicalName = "Greek",
		characters = "ἀ-῾" .. m["Grek"].characters,
		capitalized = m["Grek"].capitalized,
		parent = "Grek",
		systems = {"alphabet"},
	}

m["Gujr"] = {
	canonicalName = "Gujarati",
	characters = "ઁ-ઃઅ-ઍએ-ઑઓ-નપ-રલળવ-હ઼-ૅે-ૉો-્ૐૠ-ૣ૦-૱ૺ-૿",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ઓ", "અાૈ", "અા", "અૅ", "અે", "અૈ", "અૉ", "અો", "અૌ", "આૅ", "આૈ", "ૅા"},
		to = {"અાૅ", "ઔ", "આ", "ઍ", "એ", "ઐ", "ઑ", "ઓ", "ઔ", "ઓ", "ઔ", "ૉ"}
	},
}

m["Guru"] = {
	canonicalName = "Gurmukhi",
	characters = "ਁ-ਃਅ-ਊਏਐਓ-ਨਪ-ਰਲਲ਼ਵਸ਼ਸਹ਼ਾ-ੂੇੈੋ-੍ੑਖ਼-ੜਫ਼੦-੶",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ਅਾ", "ਅੈ", "ਅੌ", "ੲਿ", "ੲੀ", "ੲੇ", "ੳੁ", "ੳੂ", "ੳੋ"},
		to = {"ਆ", "ਐ", "ਔ", "ਇ", "ਈ", "ਏ", "ਉ", "ਊ", "ਓ"}
	},
}

m["Hang"] = {
	canonicalName = "Hangul",
	aliases = {"Hangeul"},
	characters = (
		"가-힣".. -- Syllables
		"ᄀ-ᇿ".. -- Jamo
		"ꥠ-ꥼ".. -- Jamo Ext-A
		"ힰ-ퟻ".. -- Jamo Ext-B
		"ㄱ-ㆎ".. -- Compat Jamo
		"ﾠ-ￜ" -- Halfwidth
	),
	systems = {"syllabary"},
}

m["Hani"] = {
	canonicalName = "Han",
	varieties = {"Hanzi", "Kanji", "Hanja", "Chu Nom"},
	characters = (
		"一-鿿"..
		"㐀-䶿".. -- ExtA
		"𠀀-𮯯".. -- SIP 
		"𰀀-𲎯".. -- ExtG-H
		"﨎﨏﨑﨓﨔﨟﨡﨣﨤﨧﨨﨩"..
		"⺀-⻿".. -- Radicals Supplement
		"　-〿".. -- CJK Symbols and Punctuation
		"𖿢𖿣𖿰𖿱".. -- Ideographic Symbols and Punctuation
		"㇀-㇯".. -- Strokes
		"㍻-㍿㋿" -- 組文字
	),
	systems = {"logography"},
}

	m["Hans"] = {
		canonicalName = "Simplified Han",
		characters = m["Hani"].characters,
		systems = {"logography"},
		parent = "Hani",
	}

	m["Hant"] = {
		canonicalName = "Traditional Han",
		characters = m["Hani"].characters,
		systems = {"logography"},
		parent = "Hani",
	}

m["Hano"] = {
	canonicalName = "Hanunoo",
	characters = "ᜠ-᜴",
	systems = {"abugida"},
}

m["Hatr"] = {
	canonicalName = "Hatran",
	characters = "𐣠-𐣿",
	direction = "rtl",
	systems = {"abjad"},
}

m["Hebr"] = {
	canonicalName = "Hebrew",
	characters = u(0x0590) .. "-" .. u(0x05FF) .. u(0xFB1D) .. "-" .. u(0xFB4F),
	direction = "rtl",
	systems = {"abjad"},	-- more precisely, impure abjad
}

m["Hira"] = {
	canonicalName = "Hiragana",
	varieties = {"Hentaigana"},
	characters = "ぁ-ゟ𛀁-𛄞𛅐𛅑𛅒🈀",
	systems = {"syllabary"},
}

m["Hluw"] = {
	canonicalName = "Anatolian Hieroglyphs",
	characters = "𔐀-𔙆",
	wikipedia_article = "Anatolian hieroglyphs",
}

m["Hmng"] = {
	canonicalName = "Hmong",
	aliases = {"Pahawh Hmong"},
	characters = "𖬀-𖮏",
}

m["Hung"] = {
	canonicalName = "Old Hungarian",
	aliases = {"Hungarian runic"},
	characters = "𐲀-𐲲",
	capitalized = true,
	direction = "rtl",
}

m["Ibrn"] = {
	canonicalName = "Iberian",
}

m["Imag"] = {
	-- To be used to avoid any formatting or link processing
	canonicalName = "Image-rendered",
	-- This should not have any characters listed
	character_category = false,
}

m["Inds"] = {
	canonicalName = "Indus",
	aliases = {"Harappan", "Indus Valley"},
}

m["IPAchar"] = {
	canonicalName = "International Phonetic Alphabet",
	aliases = {"IPA"},
}

m["Ital"] = {
	canonicalName = "Old Italic",
	characters = "𐌀-𐌯",
	systems = {"alphabet"},
}

m["Java"] = {
	canonicalName = "Javanese",
	characters = "ꦀ-꧟",
	systems = {"abugida"},
}

m["Jurc"] = {
	canonicalName = "Jurchen",
}

m["Kali"] = {
	canonicalName = "Kayah Li",
	characters = "꤀-꤯",
	systems = {"abugida"},
}

m["Kana"] = {
	canonicalName = "Katakana",
	characters = "゠-ヿㇰ-ㇿ㌀-㍗ｦ-ﾟ𛀀𛅤𛅥𛅦𛅧",
	systems = {"syllabary"},
}

m["Kawi"] = {
	canonicalName = "Kawi",
	characters = "𑼀-𑽙",
	systems = {"abugida"},
}

m["Khar"] = {
	canonicalName = "Kharoshthi",
	characters = "𐨀-𐩘",
	systems = {"abugida"},
	direction = "rtl",
}

m["Khmr"] = {
	canonicalName = "Khmer",
	characters = "ក-៹᧠-᧿",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ឣ", "ឤ"},
		to = {"អ", "អា"}
	},
}

m["Khoj"] = {
	canonicalName = "Khojki",
	characters = "𑈀-𑈾",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"𑈀𑈬𑈱", "𑈀𑈬", "𑈀𑈱", "𑈀𑈳", "𑈁𑈱", "𑈆𑈬", "𑈬𑈰", "𑈬𑈱", "𑉀𑈮"},
		to = {"𑈇", "𑈁", "𑈅", "𑈇", "𑈇", "𑈃", "𑈲", "𑈳", "𑈂"}
	},
}

m["Kitl"] = {
	canonicalName = "Khitan Large",
	systems = {"logography", "syllabary"},
}

m["Kits"] = {
	canonicalName = "Khitan Small",
	characters = "𘬀-𘳕"..u(0x16FE4),
	systems = {"logography", "syllabary"},
}

m["Knda"] = {
	canonicalName = "Kannada",
	characters = "ಀ-ೲ",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ಉಾ", "ಋಾ", "ಒೌ"},
		to = {"ಊ", "ೠ", "ಔ"}
	},
}

m["Kpel"] = {
	canonicalName = "Kpelle",
	systems = {"syllabary"},
	-- Not in Unicode
}

m["Kthi"] = {
	canonicalName = "Kaithi",
	characters = "𑂀-𑃍",
	systems = {"abugida"},
}

m["Lana"] = {
	canonicalName = "Tai Tham",
	aliases = {"Tham", "Tua Mueang", "Lanna"},
	characters = "ᨠ-᪭",
	systems = {"abugida"},
}

m["Laoo"] = {
	canonicalName = "Lao",
	characters = "ກ-ໟ",
	systems = {"abugida"},
}

m["Latn"] = {
	canonicalName = "Latin",
	aliases = {"Roman"},
	varieties = {"Rumi", "Romaji", "Rōmaji", "Romaja"},
	characters = "A-Za-zªºÀ-ÖØ-öø-ɏḀ-ỿ",
	capitalized = true,
	systems = {"alphabet"},
}

	m["Latf"] = {
		canonicalName = "Fraktur",
		otherNames = {"Blackletter"}, -- Blackletter is actually the parent "script"
		characters = m["Latn"].characters,
		capitalized = m["Latn"].capitalized,
		parent = "Latn",
	}
	
	m["Latg"] = {
		canonicalName = "Gaelic",
		otherNames = {"Irish"},
		characters = m["Latn"].characters,
		capitalized = m["Latn"].capitalized,
		parent = "Latn",
	}

	m["Latinx"] = {
		canonicalName = "Latin",
		characters = m["Latn"].characters .. "ɐ-ʸˠ-ˤᴀ-ᴥᴬ-ᵜᵢ-ᵥᵫ-ᵷᵹ-ᶾⁱⁿₐ-ₜKÅℲⅎⅠ-ↈⱠ-ⱿꜢ-ꞇꞋ-ꟊꟐꟑꟓꟕ-ꟙꟲ-ꟿꬰ-ꭚꭜ-ꭤꭦ-ꭩﬀ-ﬆＡ-Ｚａ-ｚ𐞀-𐞅𐞇-𐞰𐞲-𐞺𝼀-𝼞𝼥-𝼪",
		capitalized = m["Latn"].capitalized,
		parent = "Latn",
	}

	m["pjt-Latn"] = {
		canonicalName = "Latin",
		characters = m["Latn"].characters,
		parent = "Latn",
	}

m["Leke"] = {
	canonicalName = "Leke",
	systems = {"abugida"},
}

m["Lepc"] = {
	canonicalName = "Lepcha",
	characters = "ᰀ-ᱏ",
	systems = {"abugida"},
}

m["Limb"] = {
	canonicalName = "Limbu",
	characters = "ᤀ-᥏",
	systems = {"abugida"},
}

m["Lina"] = {
	canonicalName = "Linear A",
	characters = "𐘀-𐝧",
}

m["Linb"] = {
	canonicalName = "Linear B",
	characters = "𐀀-𐃺",
}

m["Lisu"] = {
	canonicalName = "Lisu",
	aliases = {"Fraser"},
	characters = "ꓐ-꓿𑾰",
	systems = {"alphabet"},
}

m["Loma"] = {
	canonicalName = "Loma",
	systems = {"syllabary"},
	-- Not in Unicode
}

m["Lyci"] = {
	canonicalName = "Lycian",
	characters = "𐊀-𐊜",
	systems = {"alphabet"},
}

m["Lydi"] = {
	canonicalName = "Lydian",
	characters = "𐤠-𐤿",
	direction = "rtl",
	systems = {"alphabet"},
}

m["Mahj"] = {
	canonicalName = "Mahajani",
	characters = "𑅐-𑅶",
	systems = {"abugida"},
}

m["Maka"] = {
	canonicalName = "Lontara",
	aliases = {"Makasar"},
	characters = "𑻠-𑻸",
	systems = {"abugida"},
}

m["Mand"] = {
	canonicalName = "Mandaic",
	aliases = {"Mandaean"},
	characters = "ࡀ-࡞",
	direction = "rtl",
}

m["Mani"] = {
	canonicalName = "Manichaean",
	characters = "𐫀-𐫶",
	direction = "rtl",
	systems = {"abjad"},
}

m["Marc"] = {
	canonicalName = "Marchen",
	characters = "𑱰-𑲶",
	systems = {"abugida"},
}

m["Maya"] = {
	canonicalName = "Maya",
	aliases = {"Maya hieroglyphic", "Mayan", "Mayan hieroglyphic"},
	characters = "𝋠-𝋳",
}

m["Medf"] = {
	canonicalName = "Medefaidrin",
	aliases = {"Oberi Okaime", "Oberi Ɔkaimɛ"},
	characters = "𖹀-𖺚",
	capitalized = true,
}

m["Mend"] = {
	canonicalName = "Mende",
	aliases = {"Mende Kikakui"},
	characters = "𞠀-𞣖",
	direction = "rtl",
}

m["Merc"] = {
	canonicalName = "Meroitic cursive",
	characters = "𐦠-𐦿",
	direction = "rtl",
	systems = {"abugida"},
}

m["Mero"] = {
	canonicalName = "Meroitic hieroglyphic",
	characters = "𐦀-𐦟",
	direction = "rtl",
	systems = {"abugida"},
}

m["Mlym"] = {
	canonicalName = "Malayalam",
	characters = "ഀ-ൿ",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ഇൗ", "ഉൗ", "എെ", "ഒാ", "ഒൗ", "ക്‍", "ണ്‍", "ന്‍റ", "ന്‍", "മ്‍", "യ്‍", "ര്‍", "ല്‍", "ള്‍", "ഴ്‍", "െെ", "ൻ്റ"},
		to = {"ഈ", "ഊ", "ഐ", "ഓ", "ഔ", "ൿ", "ൺ", "ൻറ", "ൻ", "ൔ", "ൕ", "ർ", "ൽ", "ൾ", "ൖ", "ൈ", "ന്റ"}
	},
}

m["Modi"] = {
	canonicalName = "Modi",
	characters = "𑘀-𑙙",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"𑘀𑘹", "𑘀𑘺", "𑘁𑘹", "𑘁𑘺"},
		to = {"𑘊", "𑘋", "𑘌", "𑘍"}
	},
}

m["Mong"] = {
	canonicalName = "Mongolian",
	aliases = {"Mongol bichig", "Hudum Mongol bichig"},
	characters = "᠀-᠅᠊-᠙ᠠ-ᡂᡸᢀ-ᢗᢦᢩ‌‍ 𑙠-𑙨",
	direction = "down",
	systems = {"alphabet"},
}

	m["mnc-Mong"] = {
		canonicalName = "Manchu",
		characters = "᠁᠄᠈-᠏ᠠᠣᠨ-ᠪᠮ-ᠰᠴ-ᠸᠺᡝᡟ-ᡡᡤ-ᡩᡬ-ᡱᡳ-ᡷᢀ-ᢈᢏᢚ-ᢥᢨᢪ‌‍ ",
		direction = "down",
		systems = {"alphabet"},
		parent = "Mong",
	}
	
	m["sjo-Mong"] = {
		canonicalName = "Xibe",
		aliases = {"Sibe"},
		characters = "᠄᠇᠊-᠏ᠠᠣᠨᠪᠮ-ᠰᠴ-ᠸᠺᡝ-ᡲ‌‍ ",
		direction = "down",
		systems = {"alphabet"},
		parent = "mnc-Mong",
	}
	
	m["xwo-Mong"] = {
		canonicalName = "Clear Script",
		aliases = {"Todo", "Todo bichig"},
		characters = "᠀᠁᠄-᠆᠊-ᠠᠨᠯ-ᠱᠴᠷᠸᠺᠻᡀᡃ-ᡜᢀ-ᢇᢉ-ᢏᢔᢖ-ᢙᢧ‌‍ 𑙩-𑙬",
		direction = "down",
		systems = {"alphabet"},
		parent = "Mong",
	}

m["Moon"] = {
	canonicalName = "Moon",
	aliases = {"Moon System of Embossed Reading", "Moon type", "Moon writing", "Moon alphabet", "Moon code"},
	systems = {"alphabet"},
	-- Not in Unicode
}

m["Morse"] = {
	canonicalName = "Morse code",
}

m["Mroo"] = {
	canonicalName = "Mro",
	characters = "𖩀-𖩯",
}

m["Mtei"] = {
	canonicalName = "Meitei Mayek",
	aliases = {"Meetei Mayek", "Manipuri"},
	characters = "ꯀ-꯹ꫠ-꫶",
	systems = {"abugida"},
}

m["Mult"] = {
	canonicalName = "Multani",
	characters = "𑊀-𑊩",
	systems = {"abugida"},
}

m["musical"] = {
	canonicalName = "Musical notation",
	characters = "𝄀-𝇨",
	systems = {"pictography"},
}

m["Mymr"] = {
	canonicalName = "မန်း",
	aliases = {"Myanmar"},
	characters = "က-႟ꩠ-ꩿꧠ-ꧾ",
	systems = {"abugida"},
}

m["Nagm"] = {
	canonicalName = "Nag Mundari",
	characters = "𞓐-𞓹",
	systems = {"alphabet"},
}

m["Nand"] = {
	canonicalName = "Nandinagari",
	characters = "𑦠-𑧤",
	systems = {"abugida"},
}

m["Narb"] = {
	canonicalName = "Old North Arabian",
	characters = "𐪀-𐪟",
	direction = "rtl",
	systems = {"abjad"},
}

m["Nbat"] = {
	canonicalName = "Nabataean",
	aliases = {"Nabatean"},
	characters = "𐢀-𐢯",
	direction = "rtl",
	systems = {"abjad"},
}

m["Newa"] = {
	canonicalName = "Newa",
	aliases = {"Newar", "Newari", "Prachalit Nepal"},
	characters = "𑐀-𑑡",
	systems = {"abugida"},
}

m["Nkdb"] = {
	canonicalName = "Naxi Dongba",
	systems = {"pictography"},
	-- Not in Unicode
}

m["Nkgb"] = {
	canonicalName = "Nakhi Geba",
	systems = {"syllabary"},
	-- Not in Unicode
}

m["Nkoo"] = {
	canonicalName = "N'Ko",
	characters = "߀-߿",
	direction = "rtl",
	systems = {"alphabet"},
}

m["None"] = {
	canonicalName = "Unspecified", -- renders as 'unspecified script'
	-- This should not have any characters listed
	character_category = false, -- none
}

m["Nshu"] = {
	canonicalName = "Nüshu",
	aliases = {"Nushu"},
	characters = "𖿡𛅰-𛋻",
	systems = {"syllabary"},
}

m["Ogam"] = {
	canonicalName = "Ogham",
	characters = " -᚜",
}

m["Olck"] = {
	canonicalName = "Ol Chiki",
	characters = "᱐-᱿",
}

m["Orkh"] = {
	canonicalName = "Orkhon runes",
	characters = "𐰀-𐱈",
	direction = "rtl",
}

m["Orya"] = {
	canonicalName = "Oriya",
	aliases = {"Odia"},
	characters = "ଁ-୷",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ଅା", "ଏୗ", "ଓୗ"},
		to = {"ଆ", "ଐ", "ଔ"}
	},
}

m["Osge"] = {
	canonicalName = "Osage",
	characters = "𐒰-𐓻",
	capitalized = true,
}

m["Osma"] = {
	canonicalName = "Osmanya",
	characters = "𐒀-𐒩",
}

m["Ougr"] = {
	canonicalName = "Old Uyghur",
	characters = "𐽰-𐾉",
	direction = "down",
	systems = {"abjad", "alphabet"},
}

m["Palm"] = {
	canonicalName = "Palmyrene",
	characters = "𐡠-𐡿",
	direction = "rtl",
}

m["Pauc"] = {
	canonicalName = "Pau Cin Hau",
	characters = "𑫀-𑫸",
}

m["Perm"] = {
	canonicalName = "Old Permic",
	characters = "𐍐-𐍺",
}

m["Phag"] = {
	canonicalName = "Phags-pa",
	characters = "᠂᠃᠅‌‍ 。ꡀ-꡷",
	direction = "down",
	systems = {"abugida"},
}

m["Phli"] = {
	canonicalName = "Inscriptional Pahlavi",
	characters = "𐭠-𐭿",
	direction = "rtl",
	systems = {"abjad"},
}

m["Phlp"] = {
	canonicalName = "Psalter Pahlavi",
	characters = "𐮀-𐮯",
	direction = "rtl",
	systems = {"abjad"},
}

m["Phlv"] = {
	canonicalName = "Book Pahlavi",
	direction = "rtl",
	systems = {"abjad"},
	-- Not in Unicode
}

m["Phnx"] = {
	canonicalName = "Phoenician",
	characters = "𐤀-𐤟",
	direction = "rtl",
	systems = {"abjad"},
}

m["Plrd"] = {
	canonicalName = "Pollard",
	characters = "𖼀-𖾟",
	systems = {"abugida"},
}

m["Prti"] = {
	canonicalName = "Inscriptional Parthian",
	characters = "𐭀-𐭟",
	direction = "rtl",
}

m["Ranj"] = {
	canonicalName = "Ranjana",
	systems = {"abugida"},
	-- Not in Unicode
}

m["Rjng"] = {
	canonicalName = "Rejang",
	characters = "ꤰ-꥟",
	systems = {"abugida"},
}

m["Rohg"] = {
	canonicalName = "Hanifi Rohingya",
	characters = "𐴀-𐴹",
	direction = "rtl",
	systems = {"alphabet"},
}

m["Roro"] = {
	canonicalName = "Rongorongo",
	-- Not in Unicode
}

m["Ruminumerals"] = {
	canonicalName = "Rumi numerals",
	characters = "𐹠-𐹾",
	character_category = "Rumi numerals",
}

m["Runr"] = {
	canonicalName = "Runic",
	characters = "ᚠ-ᛰ",
	systems = {"alphabet"},
}

m["Samr"] = {
	canonicalName = "Samaritan",
	characters = "ࠀ-࠾",
	direction = "rtl",
	systems = {"abjad"},
}

m["Sarb"] = {
	canonicalName = "Old South Arabian",
	characters = "𐩠-𐩿",
	direction = "rtl",
	systems = {"abjad"},
}

m["Saur"] = {
	canonicalName = "Saurashtra",
	characters = "ꢀ-꣙",
	systems = {"abugida"},
}

m["Semap"] = {
	canonicalName = "flag semaphore",
	systems = {"pictography"},
}

m["Sgnw"] = {
	canonicalName = "SignWriting",
	characters = "𝠀-𝪯",
	systems = {"pictography"},
}

m["Shaw"] = {
	canonicalName = "Shavian",
	characters = "𐑐-𐑿",
}

m["Shrd"] = {
	canonicalName = "Sharada",
	characters = "𑆀-𑇙",
	systems = {"abugida"},
}

m["Shui"] = {
	canonicalName = "Sui",
	systems = {"logography"},
	-- Not in Unicode
}

m["Sidd"] = {
	canonicalName = "Siddham",
	characters = "𑖀-𑗝",
	systems = {"abugida"},
}

m["Sind"] = {
	canonicalName = "Khudawadi",
	characters = "𑊰-𑋹",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"𑊰𑋠", "𑊰𑋥", "𑊰𑋦", "𑊰𑋧", "𑊰𑋨"},
		to = {"𑊱", "𑊶", "𑊷", "𑊸", "𑊹"}
	},
}

m["Sinh"] = {
	canonicalName = "Sinhalese",
	aliases = {"Sinhala"},
	characters = "ං-෴",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"අා", "අැ", "අෑ", "උෟ", "ඍෘ", "ඏෟ", "එ්", "එෙ", "ඔෟ", "ෘෘ"},
		to = {"ආ", "ඇ", "ඈ", "ඌ", "ඎ", "ඐ", "ඒ", "ඓ", "ඖ", "ෲ"}
	},
}

m["Sogd"] = {
	canonicalName = "Sogdian",
	characters = "𐼰-𐽙",
	direction = "rtl",
	systems = {"abjad"},
}

m["Sogo"] = {
	canonicalName = "Old Sogdian",
	characters = "𐼀-𐼧",
	direction = "rtl",
	systems = {"abjad"},
}

m["Sora"] = {
	canonicalName = "Sorang Sompeng",
	aliases = {"Sora Sompeng"},
	characters = "𑃐-𑃹",
}

m["Soyo"] = {
	canonicalName = "Soyombo",
	characters = "𑩐-𑪢",
	systems = {"abugida"},
}

m["Sund"] = {
	canonicalName = "Sundanese",
	characters = "ᮀ-ᮿ",
	systems = {"abugida"},
}

m["Sylo"] = {
	canonicalName = "Syloti Nagri",
	aliases = {"Sylheti Nagari"},
	characters = "ꠀ-꠫",
	systems = {"abugida"},
}

m["Syrc"] = {
	canonicalName = "Syriac",
	characters = "܀-ݏ"..u(0x0860).."-"..u(0x086A),
	direction = "rtl",
	systems = {"abjad"},	-- more precisely, impure abjad
}

-- Syre, Syrj, Syrn are apparently subsumed into Syrc; discuss if this causes issues

m["Tagb"] = {
	canonicalName = "Tagbanwa",
	characters = "ᝠ-ᝳ",
	systems = {"abugida"},
}

m["Takr"] = {
	canonicalName = "Takri",
	characters = "𑚀-𑛉",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"𑚀𑚭", "𑚀𑚴", "𑚀𑚵", "𑚆𑚲"},
		to = {"𑚁", "𑚈", "𑚉", "𑚇"}
	},
}

m["Tale"] = {
	canonicalName = "Tai Nüa",
	aliases = {"Tai Nuea", "New Tai Nüa", "New Tai Nuea", "Dehong Dai", "Tai Dehong", "Tai Le"},
	characters = "ᥐ-ᥴ",
	systems = {"abugida"},
}

m["Talu"] = {
	canonicalName = "New Tai Lue",
	characters = "ᦀ-᧟",
	systems = {"abugida"},
}

m["Taml"] = {
	canonicalName = "Tamil",
	characters = "ஂ-௺𑿀-𑿿",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"அூ", "ஸ்ரீ"},
		to = {"ஆ", "ஶ்ரீ"}
	},
}

m["Tang"] = {
	canonicalName = "Tangut",
	characters = "𖿠𗀀-𘫿𘴀-𘴈",
	systems = {"logography", "syllabary"},
}

m["Tavt"] = {
	canonicalName = "Tai Viet",
	characters = "ꪀ-꫟",
	systems = {"abugida"},
}

m["Telu"] = {
	canonicalName = "Telugu",
	characters = "ఀ-౿",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"ఒౌ", "ఒౕ", "ిౕ", "ెౕ", "ొౕ"},
		to = {"ఔ", "ఓ", "ీ", "ే", "ో"}
	},
}

m["Teng"] = {
	canonicalName = "Tengwar",
}

m["Tfng"] = {
	canonicalName = "Tifinagh",
	otherNames = {"Libyco-Berber", "Berber"}, -- per Wikipedia, Libyco-Berber is the parent
	characters = "ⴰ-⵿",
	systems = {"abjad", "alphabet"},
}

m["Tglg"] = {
	canonicalName = "Baybayin",
	aliases = {"Tagalog"},
	characters = "ᜀ-᜔",
	systems = {"abugida"},
}

m["Thaa"] = {
	canonicalName = "Thaana",
	characters = "ހ-ޱ",
	systems = {"abugida"},
	direction = "rtl",
}

m["Thai"] = {
	canonicalName = "Thai",
	characters = "ก-๛",
	systems = {"abugida"},
}

m["Tibt"] = {
	canonicalName = "Tibetan",
	characters = "ༀ-࿚",
	systems = {"abugida"},
	normalizationFixes = {
		combiningClasses = {["༹"] = 1},
		from = {"ཷ", "ཹ"},
		to = {"ྲཱྀ", "ླཱྀ"}
	},
}

	m["sit-tam-Tibt"] = {
		canonicalName = "Tamyig",
		characters = m["Tibt"].characters,
		systems = {"abugida"},
		parent = "Tibt",
		normalizationFixes = m["Tibt"].normalizationFixes,
	}

	m["xzh-Tibt"] = {
		canonicalName = "Zhang-Zhung",
		systems = {"abugida"},
		parent = "Tibt",
		normalizationFixes = m["Tibt"].normalizationFixes,
	}

m["Tirh"] = {
	canonicalName = "Tirhuta",
	characters = "𑒀-𑓙",
	systems = {"abugida"},
	normalizationFixes = {
		from = {"𑒁𑒰", "𑒋𑒺", "𑒍𑒺", "𑒪𑒵", "𑒪𑒶"},
		to = {"𑒂", "𑒌", "𑒎", "𑒉", "𑒊"}
	},
}

m["Tnsa"] = {
	canonicalName = "Tangsa",
	characters = "𖩰-𖫉",
	systems = {"alphabet"},
}

m["Toto"] = {
	canonicalName = "Toto",
	characters = "𞊐-𞊮",
	systems = {"abugida"},
}

m["Ugar"] = {
	canonicalName = "Ugaritic",
	characters = "𐎀-𐎟",
	systems = {"abjad"},
}

m["Vaii"] = {
	canonicalName = "Vai",
	characters = "ꔀ-ꘫ",
	systems = {"syllabary"},
}

m["Visp"] = {
	canonicalName = "Visible Speech",
	systems = {"alphabet"},
	-- Not in Unicode
}

m["Vith"] = {
	canonicalName = "Vithkuqi",
	characters = "𐕰-𐖼",
	capitalized = true,
	systems = {"alphabet"},
}

m["Wara"] = {
	canonicalName = "Varang Kshiti",
	characters = "𑢠-𑣿",
	capitalized = true,
}

m["Wcho"] = {
	canonicalName = "Wancho",
	characters = "𞋀-𞋿",
	systems = {"alphabet"},
}

m["Wole"] = {
	canonicalName = "Woleai",
	systems = {"syllabary"},
	-- Not in Unicode
}

m["Xpeo"] = {
	canonicalName = "Old Persian",
	characters = "𐎠-𐏕",
}

m["Xsux"] = {
	canonicalName = "Cuneiform",
	aliases = {"Sumero-Akkadian Cuneiform"},
	characters = "𒀀-𒎙𒐀-𒑳",
}

m["Yiii"] = {
	canonicalName = "Yi",
	characters = "ꀀ-꓆",
	systems = {"syllabary"},
}

m["Zanb"] = {
	canonicalName = "Zanabazar Square",
	characters = u(0x11A00).."-"..u(0x11A47),
}

m["Zmth"] = {
	canonicalName = "mathematical notation",
	characters = "ℵ∀-⋿⟀-⟯⦀-⫿𝐀-𝟿",
	character_category = "Mathematical notation symbols", -- ?
}

m["Zsym"] = {
	canonicalName = "symbol",
	characters = "─-➿←-⇿⌀-⏿⬀-⯾🀀-🃵🌀-🩭",
	character_category = false, -- none
	systems = {"pictography"},
}

m["Zyyy"] = {
	canonicalName = "undetermined",
	-- This should not have any characters listed, probably
	character_category = false, -- none
	characters = m["Latn"].characters,
}

m["Zzzz"] = {
	canonicalName = "uncoded",
	-- This should not have any characters listed
	character_category = false, -- none
}

-- These should be defined after the scripts they are composed of

m["Jpan"] = {
	canonicalName = "Japanese",
	characters = m["Hira"].characters .. m["Kana"].characters .. m["Hani"].characters .. m["Latn"].characters,
	systems = {"syllabary", "logography"},
}

m["Kore"] = {
	canonicalName = "Korean",
	characters = m["Hang"].characters .. m["Hani"].characters,
	systems = {"syllabary", "logography"},
}

return m