datacommonsorg · gmechali · Apr 17, 2026 · Apr 7, 2026 · Apr 7, 2026 · Apr 7, 2026
diff --git a/packages/datacommons-api/datacommons_api/api_cli.py b/packages/datacommons-api/datacommons_api/api_cli.py
@@ -18,7 +18,7 @@
 from datacommons_api.app import app
 from datacommons_api.core.config import get_config, initialize_config
 from datacommons_api.core.logging import get_logger, setup_logging
-from datacommons_db.session import get_session, initialize_db
+from datacommons_db.session import get_session
 from datacommons_api.services.graph_service import GraphService
 
 setup_logging()
@@ -56,16 +56,7 @@ def start(
         gcp_spanner_database_name=gcp_spanner_database_name,
     )
 
-    # Initialize the database
-    logger.info("Initializing database...")
-    logger.info("GCP Project ID: %s", config.GCP_PROJECT_ID)
-    logger.info("GCP Spanner Instance ID: %s", config.GCP_SPANNER_INSTANCE_ID)
-    logger.info("GCP Spanner Database Name: %s", config.GCP_SPANNER_DATABASE_NAME)
-    initialize_db(
-        config.GCP_PROJECT_ID,
-        config.GCP_SPANNER_INSTANCE_ID,
-        config.GCP_SPANNER_DATABASE_NAME,
-    )
+
     logger.info("Starting API server...")
     uvicorn.run(
         app,

diff --git a/packages/datacommons-db/datacommons_db/models/edge.py b/packages/datacommons-db/datacommons_db/models/edge.py
@@ -35,25 +35,12 @@ class EdgeModel(Base):
     )
     predicate = sa.Column(String(1024), primary_key=True)
     object_id = sa.Column(String(1024), primary_key=True)
-    object_value = sa.Column(String(OBJECT_VALUE_MAX_LENGTH), nullable=True)
-    object_bytes = sa.Column(sa.LargeBinary(), nullable=True)
-    object_hash = sa.Column(String(64), primary_key=True, nullable=True)
-    provenance = sa.Column(String(1024), primary_key=True, nullable=True)
-    # Use deferred to avoid loading the node data into memory
-    object_value_tokenlist = deferred(
-        sa.Column(Text(), nullable=True)
-    )  #  TOKENLIST is a Spanner type, but represented as String in SQLAlchemy
+    provenance = sa.Column(String(1024), primary_key=True, nullable=False)
 
     # Define relationships to both source and target nodes
     source_node = relationship(
         "NodeModel", foreign_keys=[subject_id], back_populates="outgoing_edges"
     )
 
-    # Indexes
-    __table_args__ = (
-        # Index for object_value lookups
-        sa.Index("EdgeByObjectValue", "object_value"),
-    )
-
     def __repr__(self):
         return f"<EdgeModel(subject_id='{self.subject_id}', predicate='{self.predicate}', object_id='{self.object_id}')>"
diff --git a/packages/datacommons-db/datacommons_db/session.py b/packages/datacommons-db/datacommons_db/session.py
@@ -14,14 +14,14 @@
 
 import logging
 
-from sqlalchemy import Engine, create_engine, inspect
+from sqlalchemy import Engine, create_engine
 from sqlalchemy.orm import Session, sessionmaker
 
 from datacommons_db.models.base import Base
 
 logger = logging.getLogger(__name__)
 
-REQUIRED_TABLES = ["Edge", "Node", "Observation"]
+
 
 
 def get_engine(project_id: str, instance_id: str, database_name: str) -> Engine:
@@ -56,31 +56,4 @@ def get_session(project_id: str, instance_id: str, database_name: str) -> Sessio
     return session()
 
 
-def initialize_db(project_id: str, instance_id: str, database_name: str):
-    """Initialize the Spanner database.
-
-    Args:
-      project_id: GCP project ID
-      instance_id: Cloud Spanner instance ID
-      database_name: Cloud Spanner database name
-    """
-    engine = get_engine(project_id, instance_id, database_name)
 
-    # Check if database is empty by inspecting existing tables
-    inspector = inspect(engine)
-    existing_tables = inspector.get_table_names()
-
-    # Check if all required tables exist
-    missing_tables = [
-        table for table in REQUIRED_TABLES if table not in existing_tables
-    ]
-    if missing_tables:
-        logger.warning(
-            "Missing required tables in database %s: %s", database_name, missing_tables
-        )
-
-    # Only create tables if database is completely empty
-    if not existing_tables or missing_tables:
-        # Import all models so they are properly initialized with the call to Base.metadata.create_all
-        logger.info("Creating tables %s in database %s", REQUIRED_TABLES, database_name)
-        Base.metadata.create_all(engine)