apache · elharo · Feb 9, 2025 · Jan 30, 2025 · Jan 30, 2025 · Jan 30, 2025
diff --git a/.../maven-artifact/src/main/java/org/apache/maven/artifact/versioning/ComparableVersion.java b/.../maven-artifact/src/main/java/org/apache/maven/artifact/versioning/ComparableVersion.java
@@ -656,7 +656,20 @@ public final void parseVersion(String version) {
         int startIndex = 0;
 
         for (int i = 0; i < version.length(); i++) {
-            char c = version.charAt(i);
+            char character = version.charAt(i);
+            int c = character;
+            if (Character.isHighSurrogate(character)) {
+                // read the next character as a low surrogate and combine into a single int
+                try {
+                    char low = version.charAt(i + 1);
+                    char[] both = {character, low};
+                    c = Character.codePointAt(both, 0);
+                    i++;
+                } catch (IndexOutOfBoundsException ex) {
+                    // high surrogate without low surrogate. Not a lot we can do here except treat it as a regular
+                    // character
+                }
+            }
 
             if (c == '.') {
                 if (i == startIndex) {
@@ -687,7 +700,8 @@ public final void parseVersion(String version) {
                     stack.push(list);
                 }
                 isCombination = false;
-            } else if (Character.isDigit(c)) {
+                // TODO we might not want to use isDigit here; just check for ASCII digits only
+            } else if (c >= '0' && c <= '9') {
                 if (!isDigit && i > startIndex) {
                     // X1
                     isCombination = true;

diff --git a/...en-artifact/src/test/java/org/apache/maven/artifact/versioning/ComparableVersionTest.java b/...en-artifact/src/test/java/org/apache/maven/artifact/versioning/ComparableVersionTest.java
@@ -222,6 +222,33 @@ void testLeadingZeroes() {
         checkVersionsOrder("0.2", "1.0.7");
     }
 
+    @Test
+    void testDigitGreaterThanNonAscii() {
+        ComparableVersion c1 = new ComparableVersion("1");
+        ComparableVersion c2 = new ComparableVersion("é");
+        assertTrue(c1.compareTo(c2) > 0, "expected " + "1" + " > " + "\uD835\uDFE4");
+        assertTrue(c2.compareTo(c1) < 0, "expected " + "\uD835\uDFE4" + " < " + "1");
+    }
+
+    @Test
+    void testDigitGreaterThanNonBmpCharacters() {
+        ComparableVersion c1 = new ComparableVersion("1");
+        // MATHEMATICAL SANS-SERIF DIGIT TWO
+        ComparableVersion c2 = new ComparableVersion("\uD835\uDFE4");
+        assertTrue(c1.compareTo(c2) > 0, "expected " + "1" + " > " + "\uD835\uDFE4");
+        assertTrue(c2.compareTo(c1) < 0, "expected " + "\uD835\uDFE4" + " < " + "1");
+    }
+
+    @Test
+    void testNonAsciiDigits() {
+        // These should be treated the same as non-digit characters
+        ComparableVersion c1 = new ComparableVersion("1");
+        // ArabicIndicNine
+        ComparableVersion c2 = new ComparableVersion("\u0669");
+        assertTrue(c1.compareTo(c2) > 0, "expected " + "1" + " > " + "\u0669");
+        assertTrue(c2.compareTo(c1) < 0, "expected " + "\u0669" + " < " + "1");
+    }
+
     @Test
     void testGetCanonical() {
         // MNG-7700