apache · jonvex · May 12, 2025 · May 12, 2025 · May 13, 2025 · May 13, 2025
diff --git a/...spark-client/src/main/java/org/apache/hudi/client/utils/SparkInternalSchemaConverter.java b/...spark-client/src/main/java/org/apache/hudi/client/utils/SparkInternalSchemaConverter.java
@@ -267,8 +267,10 @@ private static DataType constructSparkSchemaFromType(Type type) {
       case DATE:
         return DateType$.MODULE$;
       case TIME:
+      case TIME_MILLIS:
         throw new UnsupportedOperationException(String.format("cannot convert %s type to Spark", type));
       case TIMESTAMP:
+      case TIMESTAMP_MILLIS:
         // todo support TimeStampNTZ
         return TimestampType$.MODULE$;
       case STRING:

diff --git a/hudi-client/hudi-spark-client/src/main/scala/org/apache/spark/sql/HoodieDataTypeUtils.scala b/hudi-client/hudi-spark-client/src/main/scala/org/apache/spark/sql/HoodieDataTypeUtils.scala
@@ -39,7 +39,9 @@ object HoodieDataTypeUtils {
     StructType.fromString(jsonSchema)
 
   def canUseRowWriter(schema: Schema, conf: Configuration): Boolean = {
-    if (conf.getBoolean(AvroWriteSupport.WRITE_OLD_LIST_STRUCTURE, true)) {
+    if (HoodieAvroUtils.hasTimestampMillisField(schema)) {
+      false
+    } else if (conf.getBoolean(AvroWriteSupport.WRITE_OLD_LIST_STRUCTURE, true)) {
       // if we can write lists with the old list structure, we can use row writer regardless of decimal precision
       true
     } else if (!HoodieAvroUtils.hasSmallPrecisionDecimalField(schema)) {

diff --git a/hudi-common/src/main/java/org/apache/hudi/avro/HoodieAvroUtils.java b/hudi-common/src/main/java/org/apache/hudi/avro/HoodieAvroUtils.java
@@ -1255,6 +1255,33 @@ public static boolean hasListOrMapField(Schema schema) {
     }
   }
 
+  /**
+   * Checks whether the provided schema contains a timestamp millis field
+   * @param schema input
+   * @return true if a timestamp millis field is present, false otherwise
+   */
+  public static boolean hasTimestampMillisField(Schema schema) {
+    switch (schema.getType()) {
+      case RECORD:
+        for (Field field : schema.getFields()) {
+          if (hasTimestampMillisField(field.schema())) {
+            return true;
+          }
+        }
+        return false;
+      case ARRAY:
+        return hasTimestampMillisField(schema.getElementType());
+      case MAP:
+        return hasTimestampMillisField(schema.getValueType());
+      case UNION:
+        return hasTimestampMillisField(getActualSchemaFromUnion(schema, null));
+      case LONG:
+        return LogicalTypes.timestampMillis().equals(schema.getLogicalType());
+      default:
+        return false;
+    }
+  }
+
   /**
    * Avro does not support type promotion from numbers to string. This function returns true if
    * it will be necessary to rewrite the record to support this promotion.

diff --git a/hudi-common/src/main/java/org/apache/hudi/expression/Comparators.java b/hudi-common/src/main/java/org/apache/hudi/expression/Comparators.java
@@ -39,7 +39,9 @@ public class Comparators {
           put(Types.DoubleType.get(), Comparator.naturalOrder());
           put(Types.DateType.get(), Comparator.naturalOrder());
           put(Types.TimeType.get(), Comparator.naturalOrder());
+          put(Types.TimeMillisType.get(), Comparator.naturalOrder());
           put(Types.TimestampType.get(), Comparator.naturalOrder());
+          put(Types.TimestampMillisType.get(), Comparator.naturalOrder());
           put(Types.StringType.get(), Comparator.naturalOrder());
           put(Types.UUIDType.get(), Comparator.naturalOrder());
         }

diff --git a/hudi-common/src/main/java/org/apache/hudi/internal/schema/Type.java b/hudi-common/src/main/java/org/apache/hudi/internal/schema/Type.java
@@ -62,7 +62,9 @@ enum TypeID {
     DATE(Integer.class),
     BOOLEAN(Boolean.class),
     TIME(Long.class),
+    TIME_MILLIS(Integer.class),
     TIMESTAMP(Long.class),
+    TIMESTAMP_MILLIS(Long.class),
     DECIMAL(BigDecimal.class),
     UUID(UUID.class);
     private final String name;

diff --git a/hudi-common/src/main/java/org/apache/hudi/internal/schema/Types.java b/hudi-common/src/main/java/org/apache/hudi/internal/schema/Types.java
@@ -187,6 +187,30 @@ public String toString() {
     }
   }
 
+  /**
+   * Time primitive type.
+   */
+  public static class TimeMillisType extends PrimitiveType {
+    private static final TimeMillisType INSTANCE = new TimeMillisType();
+
+    public static TimeMillisType get() {
+      return INSTANCE;
+    }
+
+    private TimeMillisType() {
+    }
+
+    @Override
+    public TypeID typeId() {
+      return TypeID.TIME_MILLIS;
+    }
+
+    @Override
+    public String toString() {
+      return "time-millis";
+    }
+  }
+
   /**
    * Time primitive type.
    */
@@ -211,6 +235,30 @@ public String toString() {
     }
   }
 
+  /**
+   * Time primitive type.
+   */
+  public static class TimestampMillisType extends PrimitiveType {
+    private static final TimestampMillisType INSTANCE = new TimestampMillisType();
+
+    public static TimestampMillisType get() {
+      return INSTANCE;
+    }
+
+    private TimestampMillisType() {
+    }
+
+    @Override
+    public TypeID typeId() {
+      return TypeID.TIMESTAMP_MILLIS;
+    }
+
+    @Override
+    public String toString() {
+      return "timestamp-millis";
+    }
+  }
+
   /**
    * String primitive type.
    */

diff --git a/...on/src/main/java/org/apache/hudi/internal/schema/convert/AvroInternalSchemaConverter.java b/...on/src/main/java/org/apache/hudi/internal/schema/convert/AvroInternalSchemaConverter.java
@@ -345,14 +345,13 @@ private static Type visitAvroPrimitiveToBuildInternalType(Schema primitive) {
       } else if (logical instanceof LogicalTypes.Date) {
         return Types.DateType.get();
 
-      } else if (
-              logical instanceof LogicalTypes.TimeMillis
-                      || logical instanceof LogicalTypes.TimeMicros) {
+      } else if  (logical instanceof LogicalTypes.TimeMillis) {
+        return Types.TimeMillisType.get();
+      } else if (logical instanceof LogicalTypes.TimeMicros) {
         return Types.TimeType.get();
-
-      } else if (
-              logical instanceof LogicalTypes.TimestampMillis
-                      || logical instanceof LogicalTypes.TimestampMicros) {
+      } else if (logical instanceof LogicalTypes.TimestampMillis) {
+        return Types.TimestampMillisType.get();
+      } else if (logical instanceof LogicalTypes.TimestampMicros) {
         return Types.TimestampType.get();
       } else if (LogicalTypes.uuid().getName().equals(name)) {
         return Types.UUIDType.get();
@@ -542,9 +541,15 @@ private static Schema visitInternalPrimitiveToBuildAvroPrimitiveType(Type.Primit
       case TIME:
         return LogicalTypes.timeMicros().addToSchema(Schema.create(Schema.Type.LONG));
 
+      case TIME_MILLIS:
+        return LogicalTypes.timeMillis().addToSchema(Schema.create(Schema.Type.INT));
+
       case TIMESTAMP:
         return LogicalTypes.timestampMicros().addToSchema(Schema.create(Schema.Type.LONG));
 
+      case TIMESTAMP_MILLIS:
+        return LogicalTypes.timestampMillis().addToSchema(Schema.create(Schema.Type.LONG));
+
       case STRING:
         return Schema.create(Schema.Type.STRING);
 

diff --git a/hudi-common/src/main/java/org/apache/hudi/internal/schema/utils/SerDeHelper.java b/hudi-common/src/main/java/org/apache/hudi/internal/schema/utils/SerDeHelper.java
@@ -217,8 +217,12 @@ private static Type parseTypeFromJson(JsonNode jsonNode) {
           return Types.DateType.get();
         case TIME:
           return Types.TimeType.get();
+        case TIME_MILLIS:
+          return Types.TimeMillisType.get();
         case TIMESTAMP:
           return Types.TimestampType.get();
+        case TIMESTAMP_MILLIS:
+          return Types.TimestampMillisType.get();
         case STRING:
           return Types.StringType.get();
         case UUID:

diff --git a/hudi-common/src/test/java/org/apache/hudi/avro/TestHoodieAvroUtils.java b/hudi-common/src/test/java/org/apache/hudi/avro/TestHoodieAvroUtils.java
@@ -876,6 +876,47 @@ void testHasListOrMapField() {
     assertFalse(HoodieAvroUtils.hasListOrMapField(new Schema.Parser().parse(EXAMPLE_SCHEMA)));
   }
 
+  @Test
+  public void testHasTimestampMillisField() {
+    Schema longWithTimestampMillis = Schema.create(Schema.Type.LONG);
+    LogicalTypes.timestampMillis().addToSchema(longWithTimestampMillis);
+
+    Schema longWithTimestampMicros = Schema.create(Schema.Type.LONG);
+    LogicalTypes.timestampMicros().addToSchema(longWithTimestampMicros);
+
+    Schema plainLong = Schema.create(Schema.Type.LONG);
+    Schema plainString = Schema.create(Schema.Type.STRING);
+
+    // test simple types
+    assertTrue(HoodieAvroUtils.hasTimestampMillisField(longWithTimestampMillis));
+    assertFalse(HoodieAvroUtils.hasTimestampMillisField(longWithTimestampMicros));
+    assertFalse(HoodieAvroUtils.hasTimestampMillisField(plainLong));
+    assertFalse(HoodieAvroUtils.hasTimestampMillisField(plainString));
+
+    // test records
+    Schema recordWithTimestampMillis = Schema.createRecord("RecordWithTSMillis", null, null, false);
+    recordWithTimestampMillis.setFields(Arrays.asList(new Schema.Field("tsmicros", longWithTimestampMicros, null, null),
+        new Schema.Field("tsmillis", longWithTimestampMillis, null, null), new Schema.Field("longfield", plainLong, null, null),
+        new Schema.Field("stringfield", plainString, null, null)));
+    assertTrue(HoodieAvroUtils.hasTimestampMillisField(recordWithTimestampMillis));
+    Schema recordWithoutTimestampMillis = Schema.createRecord("RecordWithoutTSMillis", null, null, false);
+    recordWithoutTimestampMillis.setFields(Arrays.asList(new Schema.Field("stringfield", plainString, null, null),
+        new Schema.Field("tsmicros", longWithTimestampMicros, null, null), new Schema.Field("longfield", plainLong, null, null)));
+    assertFalse(HoodieAvroUtils.hasTimestampMillisField(recordWithoutTimestampMillis));
+
+    // test arrays
+    assertTrue(HoodieAvroUtils.hasTimestampMillisField(Schema.createArray(recordWithTimestampMillis)));
+    assertFalse(HoodieAvroUtils.hasTimestampMillisField(Schema.createArray(recordWithoutTimestampMillis)));
+
+    // test maps
+    assertTrue(HoodieAvroUtils.hasTimestampMillisField(Schema.createMap(recordWithTimestampMillis)));
+    assertFalse(HoodieAvroUtils.hasTimestampMillisField(Schema.createMap(recordWithoutTimestampMillis)));
+
+    // test unions
+    assertTrue(HoodieAvroUtils.hasTimestampMillisField(Schema.createUnion(Arrays.asList(Schema.create(Schema.Type.NULL), recordWithTimestampMillis))));
+    assertFalse(HoodieAvroUtils.hasTimestampMillisField(Schema.createUnion(Arrays.asList(Schema.create(Schema.Type.NULL), recordWithoutTimestampMillis))));
+  }
+
   @Test
   void testHasSmallPrecisionDecimalField() {
     assertTrue(HoodieAvroUtils.hasSmallPrecisionDecimalField(new Schema.Parser().parse(SCHEMA_WITH_DECIMAL_FIELD)));

diff --git a/hudi-common/src/test/resources/nullRight.avsc b/hudi-common/src/test/resources/nullRight.avsc
@@ -208,6 +208,34 @@
           }
         ]
       }
+    },
+    {
+        "name": "timeMicroField",
+        "type": {
+            "type": "long",
+            "logicalType": "time-micros"
+        }
+    },
+    {
+        "name": "timeMillisField",
+        "type": {
+            "type": "int",
+            "logicalType": "time-millis"
+        }
+    },
+    {
+        "name": "timestampMicrosField",
+        "type": {
+            "type": "long",
+            "logicalType": "timestamp-micros"
+        }
+    },
+    {
+        "name": "timestampMillisField",
+        "type": {
+            "type": "long",
+            "logicalType": "timestamp-millis"
+        }
     }
   ]
 }
diff --git a/hudi-common/src/test/resources/nullWrong.avsc b/hudi-common/src/test/resources/nullWrong.avsc
@@ -198,6 +198,34 @@
           "null"
         ]
       }
+    },
+    {
+        "name": "timeMicroField",
+        "type": {
+            "type": "long",
+            "logicalType": "time-micros"
+        }
+    },
+    {
+        "name": "timeMillisField",
+        "type": {
+            "type": "int",
+            "logicalType": "time-millis"
+        }
+    },
+    {
+        "name": "timestampMicrosField",
+        "type": {
+            "type": "long",
+            "logicalType": "timestamp-micros"
+        }
+    },
+    {
+        "name": "timestampMillisField",
+        "type": {
+            "type": "long",
+            "logicalType": "timestamp-millis"
+        }
     }
   ]
 }
diff --git a/hudi-hadoop-mr/src/main/java/org/apache/hudi/hadoop/SchemaEvolutionContext.java b/hudi-hadoop-mr/src/main/java/org/apache/hudi/hadoop/SchemaEvolutionContext.java
@@ -319,13 +319,15 @@ private TypeInfo constructHiveSchemaFromType(Type type, TypeInfo typeInfo) {
       case DOUBLE:
       case DATE:
       case TIMESTAMP:
+      case TIMESTAMP_MILLIS:
       case STRING:
       case UUID:
       case FIXED:
       case BINARY:
       case DECIMAL:
         return typeInfo;
       case TIME:
+      case TIME_MILLIS:
         throw new UnsupportedOperationException(String.format("cannot convert %s type to hive", type));
       default:
         LOG.error("cannot convert unknown type: {} to Hive", type);