Source code for pyUSPTO.models.patent_data

"""
models.patent_data - Data models for USPTO patent data API

This module provides data models for the USPTO Patent Data API,
enhanced with more Pythonic features like immutability, Enums,
and native date/datetime objects.
"""

import csv
import io
import json
from dataclasses import asdict, dataclass, field
from datetime import date, datetime, timezone, tzinfo
from enum import Enum
from typing import Any, Dict, Iterator, List, Optional, Union
from zoneinfo import ZoneInfo, ZoneInfoNotFoundError

# --- Timezone and Parsing Utilities ---
ASSUMED_NAIVE_TIMEZONE_STR = "America/New_York"
try:
    ASSUMED_NAIVE_TIMEZONE: Optional[tzinfo] = ZoneInfo(ASSUMED_NAIVE_TIMEZONE_STR)
except ZoneInfoNotFoundError:
    print(
        f"Warning: Timezone '{ASSUMED_NAIVE_TIMEZONE_STR}' not found. Naive datetimes will be treated as UTC or may cause errors."
    )
    ASSUMED_NAIVE_TIMEZONE = timezone.utc



[docs]
def parse_to_date(date_str: Optional[str], fmt: str = "%Y-%m-%d") -> Optional[date]:
    if not date_str:
        return None
    try:
        return datetime.strptime(date_str, fmt).date()
    except ValueError:
        print(f"Warning: Could not parse date string '{date_str}' with format '{fmt}'")
        return None




[docs]
def parse_to_datetime_utc(datetime_str: Optional[str]) -> Optional[datetime]:
    if not datetime_str:
        return None
    dt_obj: Optional[datetime] = None
    parsed_successfully = False
    if isinstance(datetime_str, str):
        try:
            if datetime_str.endswith("Z"):
                dt_obj = datetime.fromisoformat(datetime_str.replace("Z", "+00:00"))
            else:
                dt_obj = datetime.fromisoformat(datetime_str)
            parsed_successfully = True
        except ValueError:
            pass
    if not parsed_successfully or dt_obj is None:
        print(
            f"Warning: Could not parse datetime string '{datetime_str}' with any known format."
        )
        return None
    if dt_obj.tzinfo is None or dt_obj.tzinfo.utcoffset(dt_obj) is None:
        if ASSUMED_NAIVE_TIMEZONE:
            try:
                aware_dt = dt_obj.replace(tzinfo=ASSUMED_NAIVE_TIMEZONE)
                return aware_dt.astimezone(timezone.utc)
            except Exception as e:
                print(
                    f"Warning: Error localizing naive datetime '{datetime_str}': {e}."
                )
                if ASSUMED_NAIVE_TIMEZONE == timezone.utc:
                    return dt_obj.replace(tzinfo=timezone.utc)
        return None
    else:
        return dt_obj.astimezone(timezone.utc)




[docs]
def serialize_date(d: Optional[date]) -> Optional[str]:
    return d.isoformat() if d else None




[docs]
def serialize_datetime_as_iso(dt: Optional[datetime]) -> Optional[str]:
    if not dt:
        return None
    dt_utc = (
        dt.astimezone(timezone.utc) if dt.tzinfo else dt.replace(tzinfo=timezone.utc)
    )
    return dt_utc.isoformat().replace("+00:00", "Z")




[docs]
def parse_yn_to_bool(value: Optional[str]) -> Optional[bool]:
    """Converts 'Y'/'N' (case-insensitive) string to boolean. Returns None if input is None or not Y/N."""
    if value is None:
        return None
    if value.upper() == "Y":
        return True
    if value.upper() == "N":
        return False
    print(
        f"Warning: Unexpected value for Y/N boolean string: '{value}'. Treating as None."
    )
    return None




[docs]
def serialize_bool_to_yn(value: Optional[bool]) -> Optional[str]:
    """Converts boolean to 'Y'/'N' string. Returns None if input is None."""
    if value is None:
        return None
    return "Y" if value else "N"



# --- Data Models ---

[docs]
def to_camel_case(snake_str: str) -> str:
    parts = snake_str.split("_")
    return parts[0] + "".join(x.title() for x in parts[1:])



# --- Enums for Categorical Data ---

[docs]
class DirectionCategory(Enum):
    """Represents the direction of a document relative to the USPTO (e.g., INCOMING, OUTGOING)."""

    INCOMING = "INCOMING"
    OUTGOING = "OUTGOING"




[docs]
class ActiveIndicator(Enum):
    """Represents an active or inactive status, often used for practitioners or entities."""

    YES = "Y"
    NO = "N"
    TRUE = "true"
    FALSE = "false"
    ACTIVE = "Active"

    @classmethod
    def _missing_(cls, value: Any) -> "ActiveIndicator":
        if isinstance(value, str):
            val_upper = value.upper()
            if val_upper == "Y":
                return cls.YES
            if val_upper == "N":
                return cls.NO
            if val_upper == "TRUE":
                return cls.TRUE
            if val_upper == "FALSE":
                return cls.FALSE
            if val_upper == "ACTIVE":
                return cls.ACTIVE
        return super()._missing_(value=value)  # type: ignore[no-any-return]




[docs]
@dataclass(frozen=True)
class DocumentFormat:
    """Represents an available download format for a specific document.

    Attributes:
        mime_type_identifier: The MIME type of the downloadable file (e.g., "PDF").
        download_url: The URL from which the document format can be downloaded.
        page_total_quantity: The total number of pages in this document format.
    """

    mime_type_identifier: Optional[str] = None
    download_url: Optional[str] = None
    page_total_quantity: Optional[int] = None

    def __str__(self) -> str:
        return (
            f"{self.mime_type_identifier} format with {self.page_total_quantity} pages"
        )

    def __repr__(self) -> str:
        return f"DocumentFormat(mime_type={self.mime_type_identifier}, pages={self.page_total_quantity})"


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "DocumentFormat":
        return cls(
            mime_type_identifier=data.get("mimeTypeIdentifier"),
            download_url=data.get("downloadUrl"),
            page_total_quantity=data.get("pageTotalQuantity"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "mimeTypeIdentifier": self.mime_type_identifier,
            "downloadUrl": self.download_url,
            "pageTotalQuantity": self.page_total_quantity,
        }





[docs]
@dataclass(frozen=True)
class Document:
    """Represents a single document associated with a patent application.

    This includes metadata such as its identifier, official date, code, description,
    direction (incoming/outgoing), and available download formats.
    """

    application_number_text: Optional[str] = None
    official_date: Optional[datetime] = None
    document_identifier: Optional[str] = None
    document_code: Optional[str] = None
    document_code_description_text: Optional[str] = None
    direction_category: Optional[DirectionCategory] = None
    document_formats: List[DocumentFormat] = field(default_factory=list)

    def __str__(self) -> str:
        date_str = (
            self.official_date.strftime("%Y-%m-%d") if self.official_date else "No date"
        )
        return f"Document {self.document_identifier} ({self.document_code}): {self.document_code_description_text} - {date_str}"

    def __repr__(self) -> str:
        return f"Document(id={self.document_identifier}, code={self.document_code}, date={self.official_date.strftime('%Y-%m-%d') if self.official_date else 'None'})"


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Document":
        dl_formats = [
            DocumentFormat.from_dict(f)
            for f in data.get("downloadOptionBag", [])
            if isinstance(f, dict)
        ]
        dir_val = data.get("documentDirectionCategory")
        dir_cat = None
        if dir_val:
            try:
                dir_cat = DirectionCategory(dir_val)
            except ValueError:
                print(f"Warning: Unknown document direction category '{dir_val}'.")
        return cls(
            application_number_text=data.get("applicationNumberText"),
            official_date=parse_to_datetime_utc(data.get("officialDate")),
            document_identifier=data.get("documentIdentifier"),
            document_code=data.get("documentCode"),
            document_code_description_text=data.get("documentCodeDescriptionText"),
            direction_category=dir_cat,
            document_formats=dl_formats,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = {
            "applicationNumberText": self.application_number_text,
            "officialDate": serialize_datetime_as_iso(self.official_date),
            "documentIdentifier": self.document_identifier,
            "documentCode": self.document_code,
            "documentCodeDescriptionText": self.document_code_description_text,
            "documentDirectionCategory": (
                self.direction_category.value if self.direction_category else None
            ),
            "downloadOptionBag": [df.to_dict() for df in self.document_formats],
        }
        return {
            k: v
            for k, v in d.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
class DocumentBag:
    """A collection of Document objects associated with a patent application.

    Provides iterable access to the documents.
    """

    def __init__(self, documents: List[Document]):
        self._documents = tuple(documents)

    @property
    def documents(self) -> tuple[Document, ...]:
        return self._documents

    def __iter__(self) -> Iterator[Document]:
        return iter(self._documents)

    def __len__(self) -> int:
        return len(self._documents)

    def __getitem__(self, index: int) -> Document:
        return self._documents[index]


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "DocumentBag":
        docs_data = data.get("documentBag", [])
        docs = (
            [Document.from_dict(dd) for dd in docs_data if isinstance(dd, dict)]
            if isinstance(docs_data, list)
            else []
        )
        return cls(documents=docs)



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {"documentBag": [doc.to_dict() for doc in self._documents]}





[docs]
@dataclass(frozen=True)
class Address:
    """Represents a postal address with fields for street, city, region, country, and postal code.

    It can be used for various entities like applicants, inventors, or correspondence.
    """

    name_line_one_text: Optional[str] = None
    name_line_two_text: Optional[str] = None
    address_line_one_text: Optional[str] = None
    address_line_two_text: Optional[str] = None
    address_line_three_text: Optional[str] = None
    address_line_four_text: Optional[str] = None
    geographic_region_name: Optional[str] = None
    geographic_region_code: Optional[str] = None
    postal_code: Optional[str] = None
    city_name: Optional[str] = None
    country_code: Optional[str] = None
    country_name: Optional[str] = None
    postal_address_category: Optional[str] = None
    correspondent_name_text: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Address":
        return cls(
            name_line_one_text=data.get("nameLineOneText"),
            name_line_two_text=data.get("nameLineTwoText"),
            address_line_one_text=data.get("addressLineOneText"),
            address_line_two_text=data.get("addressLineTwoText"),
            address_line_three_text=data.get("addressLineThreeText"),
            address_line_four_text=data.get("addressLineFourText"),
            geographic_region_name=data.get("geographicRegionName"),
            geographic_region_code=data.get("geographicRegionCode"),
            postal_code=data.get("postalCode"),
            city_name=data.get("cityName"),
            country_code=data.get("countryCode"),
            country_name=data.get("countryName"),
            postal_address_category=data.get("postalAddressCategory"),
            correspondent_name_text=data.get("correspondentNameText"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "nameLineOneText": self.name_line_one_text,
            "nameLineTwoText": self.name_line_two_text,
            "addressLineOneText": self.address_line_one_text,
            "addressLineTwoText": self.address_line_two_text,
            "addressLineThreeText": self.address_line_three_text,
            "addressLineFourText": self.address_line_four_text,
            "geographicRegionName": self.geographic_region_name,
            "geographicRegionCode": self.geographic_region_code,
            "postalCode": self.postal_code,
            "cityName": self.city_name,
            "countryCode": self.country_code,
            "countryName": self.country_name,
            "postalAddressCategory": self.postal_address_category,
            "correspondentNameText": self.correspondent_name_text,
        }





[docs]
@dataclass(frozen=True)
class Telecommunication:
    """Represents telecommunication details, such as phone or fax numbers.

    Attributes:
        telecommunication_number: The main number (e.g., phone number).
        extension_number: Any extension associated with the number.
        telecom_type_code: A code indicating the type of telecommunication (e.g., "TEL", "FAX").
    """

    telecommunication_number: Optional[str] = None
    extension_number: Optional[str] = None
    telecom_type_code: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Telecommunication":
        return cls(
            telecommunication_number=data.get("telecommunicationNumber"),
            extension_number=data.get("extensionNumber"),
            telecom_type_code=data.get("telecomTypeCode"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "telecommunicationNumber": self.telecommunication_number,
            "extensionNumber": self.extension_number,
            "telecomTypeCode": self.telecom_type_code,
        }





[docs]
@dataclass(frozen=True)
class Person:
    """A base data class representing a person with common name and country attributes.

    This class is typically inherited by more specific types like Applicant, Inventor, or Attorney.
    """

    first_name: Optional[str] = None
    middle_name: Optional[str] = None
    last_name: Optional[str] = None
    name_prefix: Optional[str] = None
    name_suffix: Optional[str] = None
    preferred_name: Optional[str] = None
    country_code: Optional[str] = None

    @classmethod
    def _extract_person_fields(cls, data: Dict[str, Any]) -> Dict[str, Any]:
        return {
            "first_name": data.get("firstName"),
            "middle_name": data.get("middleName"),
            "last_name": data.get("lastName"),
            "name_prefix": data.get("namePrefix"),
            "name_suffix": data.get("nameSuffix"),
            "preferred_name": data.get("preferredName"),
            "country_code": data.get("countryCode"),
        }


[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {to_camel_case(k): v for k, v in asdict(self).items() if v is not None}





[docs]
@dataclass(frozen=True)
class Applicant(Person):
    """Represents an applicant for a patent, inheriting from Person.

    Includes applicant-specific name text and a list of correspondence addresses.
    """

    applicant_name_text: Optional[str] = None
    correspondence_address_bag: List[Address] = field(default_factory=list)


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Applicant":
        pf = Person._extract_person_fields(data)
        addrs = [
            Address.from_dict(a)
            for a in data.get("correspondenceAddressBag", [])
            if isinstance(a, dict)
        ]
        return cls(
            **pf,
            applicant_name_text=data.get("applicantNameText"),
            correspondence_address_bag=addrs,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = super().to_dict()
        d.update(
            {
                "applicantNameText": self.applicant_name_text,
                "correspondenceAddressBag": [
                    a.to_dict() for a in self.correspondence_address_bag
                ],
            }
        )
        return {
            k: v
            for k, v in d.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class Inventor(Person):
    """Represents an inventor for a patent application, inheriting from Person.

    Includes inventor-specific name text and a list of correspondence addresses.
    """

    inventor_name_text: Optional[str] = None
    correspondence_address_bag: List[Address] = field(default_factory=list)


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Inventor":
        pf = Person._extract_person_fields(data)
        addrs = [
            Address.from_dict(a)
            for a in data.get("correspondenceAddressBag", [])
            if isinstance(a, dict)
        ]
        return cls(
            **pf,
            inventor_name_text=data.get("inventorNameText"),
            correspondence_address_bag=addrs,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = super().to_dict()
        d.update(
            {
                "inventorNameText": self.inventor_name_text,
                "correspondenceAddressBag": [
                    a.to_dict() for a in self.correspondence_address_bag
                ],
            }
        )
        return {
            k: v
            for k, v in d.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class Attorney(Person):
    """Represents an attorney or agent associated with a patent application, inheriting from Person.

    Includes registration number, active status, practitioner category, addresses, and telecommunication details.
    """

    registration_number: Optional[str] = None
    active_indicator: Optional[str] = None
    registered_practitioner_category: Optional[str] = None
    attorney_address_bag: List[Address] = field(default_factory=list)
    telecommunication_address_bag: List[Telecommunication] = field(default_factory=list)


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Attorney":
        pf = Person._extract_person_fields(data)
        addrs = [
            Address.from_dict(a)
            for a in data.get("attorneyAddressBag", [])
            if isinstance(a, dict)
        ]
        telecoms = [
            Telecommunication.from_dict(t)
            for t in data.get("telecommunicationAddressBag", [])
            if isinstance(t, dict)
        ]
        return cls(
            **pf,
            registration_number=data.get("registrationNumber"),
            active_indicator=data.get("activeIndicator"),
            registered_practitioner_category=data.get("registeredPractitionerCategory"),
            attorney_address_bag=addrs,
            telecommunication_address_bag=telecoms,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = super().to_dict()
        d.update(
            {
                "registrationNumber": self.registration_number,
                "activeIndicator": self.active_indicator,
                "registeredPractitionerCategory": self.registered_practitioner_category,
                "attorneyAddressBag": [a.to_dict() for a in self.attorney_address_bag],
                "telecommunicationAddressBag": [
                    t.to_dict() for t in self.telecommunication_address_bag
                ],
            }
        )
        return {
            k: v
            for k, v in d.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class EntityStatus:
    """Represents the entity status of an applicant (e.g., small entity status).

    Attributes:
        small_entity_status_indicator: Boolean indicating if the applicant qualifies for small entity status.
        business_entity_status_category: String category of the business entity status (e.g., "Undiscounted").
    """

    small_entity_status_indicator: Optional[bool] = None
    business_entity_status_category: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "EntityStatus":
        return cls(
            small_entity_status_indicator=data.get("smallEntityStatusIndicator"),
            business_entity_status_category=data.get("businessEntityStatusCategory"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "smallEntityStatusIndicator": self.small_entity_status_indicator,
            "businessEntityStatusCategory": self.business_entity_status_category,
        }





[docs]
@dataclass(frozen=True)
class CustomerNumberCorrespondence:
    """Represents correspondence data associated with a USPTO customer number.

    Includes patron identifier, organization name, power of attorney addresses, and telecommunication details.
    """

    patron_identifier: Optional[int] = None
    organization_standard_name: Optional[str] = None
    power_of_attorney_address_bag: List[Address] = field(default_factory=list)
    telecommunication_address_bag: List[Telecommunication] = field(default_factory=list)


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "CustomerNumberCorrespondence":
        addrs = [
            Address.from_dict(a)
            for a in data.get("powerOfAttorneyAddressBag", [])
            if isinstance(a, dict)
        ]
        telecoms = [
            Telecommunication.from_dict(t)
            for t in data.get("telecommunicationAddressBag", [])
            if isinstance(t, dict)
        ]
        return cls(
            patron_identifier=data.get("patronIdentifier"),
            organization_standard_name=data.get("organizationStandardName"),
            power_of_attorney_address_bag=addrs,
            telecommunication_address_bag=telecoms,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = {
            "patronIdentifier": self.patron_identifier,
            "organizationStandardName": self.organization_standard_name,
            "powerOfAttorneyAddressBag": [
                a.to_dict() for a in self.power_of_attorney_address_bag
            ],
            "telecommunicationAddressBag": [
                t.to_dict() for t in self.telecommunication_address_bag
            ],
        }
        return {
            k: v
            for k, v in d.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class RecordAttorney:
    """Represents information about the attorney(s) of record for a patent application.

    Contains customer number correspondence data, power of attorney information, and listed attorneys.
    """

    customer_number_correspondence_data: List[CustomerNumberCorrespondence] = field(
        default_factory=list
    )
    power_of_attorney_bag: List[Attorney] = field(default_factory=list)
    attorney_bag: List[Attorney] = field(default_factory=list)


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "RecordAttorney":
        cust_corr = [
            CustomerNumberCorrespondence.from_dict(c)
            for c in data.get("customerNumberCorrespondenceData", [])
            if isinstance(c, dict)
        ]
        poa_bag = [
            Attorney.from_dict(a)
            for a in data.get("powerOfAttorneyBag", [])
            if isinstance(a, dict)
        ]
        att_bag = [
            Attorney.from_dict(a)
            for a in data.get("attorneyBag", [])
            if isinstance(a, dict)
        ]
        return cls(
            customer_number_correspondence_data=cust_corr,
            power_of_attorney_bag=poa_bag,
            attorney_bag=att_bag,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = {
            "customerNumberCorrespondenceData": [
                c.to_dict() for c in self.customer_number_correspondence_data
            ],
            "powerOfAttorneyBag": [p.to_dict() for p in self.power_of_attorney_bag],
            "attorneyBag": [a.to_dict() for a in self.attorney_bag],
        }
        return {
            k: v
            for k, v in d.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class Assignor:
    """Represents an assignor in a patent assignment.

    Attributes:
        assignor_name: The name of the assigning party.
        execution_date: The date the assignment was executed.
    """

    assignor_name: Optional[str] = None
    execution_date: Optional[date] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Assignor":
        return cls(
            assignor_name=data.get("assignorName"),
            execution_date=parse_to_date(data.get("executionDate")),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "assignorName": self.assignor_name,
            "executionDate": serialize_date(self.execution_date),
        }





[docs]
@dataclass(frozen=True)
class Assignee:
    """Represents an assignee in a patent assignment.

    Attributes:
        assignee_name_text: The name of the party receiving the assignment.
        assignee_address: The address of the assignee.
    """

    assignee_name_text: Optional[str] = None
    assignee_address: Optional[Address] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Assignee":
        addr_data = data.get("assigneeAddress")
        addr = Address.from_dict(addr_data) if isinstance(addr_data, dict) else None
        return cls(
            assignee_name_text=data.get("assigneeNameText"), assignee_address=addr
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = {
            "assigneeNameText": self.assignee_name_text,
            "assigneeAddress": (
                self.assignee_address.to_dict() if self.assignee_address else None
            ),
        }
        return {k: v for k, v in d.items() if v is not None}





[docs]
@dataclass(frozen=True)
class Assignment:
    """Represents a patent assignment, detailing the transfer of rights.

    Includes information about the reel and frame, document location, dates, conveyance text,
    and bags of assignors, assignees, and correspondence addresses.
    """

    reel_number: Optional[str] = None
    frame_number: Optional[str] = None
    reel_and_frame_number: Optional[str] = None
    assignment_document_location_uri: Optional[str] = None
    assignment_received_date: Optional[date] = None
    assignment_recorded_date: Optional[date] = None
    assignment_mailed_date: Optional[date] = None
    conveyance_text: Optional[str] = None
    assignor_bag: List[Assignor] = field(default_factory=list)
    assignee_bag: List[Assignee] = field(default_factory=list)
    correspondence_address_bag: List[Address] = field(default_factory=list)


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "Assignment":
        assignors = [
            Assignor.from_dict(a)
            for a in data.get("assignorBag", [])
            if isinstance(a, dict)
        ]
        assignees = [
            Assignee.from_dict(a)
            for a in data.get("assigneeBag", [])
            if isinstance(a, dict)
        ]
        addrs = [
            Address.from_dict(a)
            for a in data.get("correspondenceAddressBag", [])
            if isinstance(a, dict)
        ]
        return cls(
            reel_number=data.get("reelNumber"),
            frame_number=data.get("frameNumber"),
            reel_and_frame_number=data.get("reelAndFrameNumber"),
            assignment_document_location_uri=data.get("assignmentDocumentLocationURI"),
            assignment_received_date=parse_to_date(data.get("assignmentReceivedDate")),
            assignment_recorded_date=parse_to_date(data.get("assignmentRecordedDate")),
            assignment_mailed_date=parse_to_date(data.get("assignmentMailedDate")),
            conveyance_text=data.get("conveyanceText"),
            assignor_bag=assignors,
            assignee_bag=assignees,
            correspondence_address_bag=addrs,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "reelNumber": self.reel_number,
            "frameNumber": self.frame_number,
            "reelAndFrameNumber": self.reel_and_frame_number,
            "assignmentDocumentLocationURI": self.assignment_document_location_uri,
            "assignmentReceivedDate": serialize_date(self.assignment_received_date),
            "assignmentRecordedDate": serialize_date(self.assignment_recorded_date),
            "assignmentMailedDate": serialize_date(self.assignment_mailed_date),
            "conveyanceText": self.conveyance_text,
            "assignorBag": [a.to_dict() for a in self.assignor_bag],
            "assigneeBag": [a.to_dict() for a in self.assignee_bag],
            "correspondenceAddressBag": [
                a.to_dict() for a in self.correspondence_address_bag
            ],
        }





[docs]
@dataclass(frozen=True)
class ForeignPriority:
    """Represents a foreign priority claim for a patent application.

    Attributes:
        ip_office_name: The name of the intellectual property office of the priority application.
        filing_date: The filing date of the priority application.
        application_number_text: The application number of the priority application.
    """

    ip_office_name: Optional[str] = None
    filing_date: Optional[date] = None
    application_number_text: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "ForeignPriority":
        return cls(
            ip_office_name=data.get("ipOfficeName"),
            filing_date=parse_to_date(data.get("filingDate")),
            application_number_text=data.get("applicationNumberText"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "ipOfficeName": self.ip_office_name,
            "filingDate": serialize_date(self.filing_date),
            "applicationNumberText": self.application_number_text,
        }





[docs]
@dataclass(frozen=True)
class Continuity:
    """Base class representing continuity data for a patent application.

    This includes details about the application's relationship to other applications (parent/child),
    its filing status under AIA (America Invents Act), and key identifiers.
    """

    first_inventor_to_file_indicator: Optional[bool] = None
    application_number_text: Optional[str] = None
    filing_date: Optional[date] = None
    status_code: Optional[int] = None
    status_description_text: Optional[str] = None
    patent_number: Optional[str] = None
    claim_parentage_type_code: Optional[str] = None
    claim_parentage_type_code_description_text: Optional[str] = None

    @property
    def is_aia(self) -> Optional[bool]:
        return self.first_inventor_to_file_indicator

    @property
    def is_pre_aia(self) -> Optional[bool]:
        if self.first_inventor_to_file_indicator is None:
            return None
        return not self.first_inventor_to_file_indicator


[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            to_camel_case(k): v
            for k, v in asdict(self).items()
            if v is not None and not k.startswith("is_")
        }





[docs]
@dataclass(frozen=True)
class ParentContinuity(Continuity):
    """Represents a parent application in a patent application's continuity chain.

    Inherits from Continuity and adds specific fields for parent application details.
    """

    parent_application_status_code: Optional[int] = None
    parent_patent_number: Optional[str] = None
    parent_application_status_description_text: Optional[str] = None
    parent_application_filing_date: Optional[date] = None
    parent_application_number_text: Optional[str] = None
    child_application_number_text: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "ParentContinuity":
        p_filing_date = parse_to_date(data.get("parentApplicationFilingDate"))
        return cls(
            first_inventor_to_file_indicator=data.get("firstInventorToFileIndicator"),
            parent_application_status_code=data.get("parentApplicationStatusCode"),
            parent_patent_number=data.get("parentPatentNumber"),
            parent_application_status_description_text=data.get(
                "parentApplicationStatusDescriptionText"
            ),
            parent_application_filing_date=p_filing_date,
            parent_application_number_text=data.get("parentApplicationNumberText"),
            child_application_number_text=data.get("childApplicationNumberText"),
            claim_parentage_type_code=data.get("claimParentageTypeCode"),
            claim_parentage_type_code_description_text=data.get(
                "claimParentageTypeCodeDescriptionText"
            ),
            application_number_text=data.get("parentApplicationNumberText"),
            filing_date=p_filing_date,
            status_code=data.get("parentApplicationStatusCode"),
            status_description_text=data.get("parentApplicationStatusDescriptionText"),
            patent_number=data.get("parentPatentNumber"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "firstInventorToFileIndicator": self.first_inventor_to_file_indicator,
            "parentApplicationStatusCode": self.parent_application_status_code,
            "parentPatentNumber": self.parent_patent_number,
            "parentApplicationStatusDescriptionText": self.parent_application_status_description_text,
            "parentApplicationFilingDate": serialize_date(
                self.parent_application_filing_date
            ),
            "parentApplicationNumberText": self.parent_application_number_text,
            "childApplicationNumberText": self.child_application_number_text,
            "claimParentageTypeCode": self.claim_parentage_type_code,
            "claimParentageTypeCodeDescriptionText": self.claim_parentage_type_code_description_text,
        }





[docs]
@dataclass(frozen=True)
class ChildContinuity(Continuity):
    """Represents a child application in a patent application's continuity chain.

    Inherits from Continuity and adds specific fields for child application details.
    """

    child_application_status_code: Optional[int] = None
    parent_application_number_text: Optional[str] = None
    child_application_number_text: Optional[str] = None
    child_application_status_description_text: Optional[str] = None
    child_application_filing_date: Optional[date] = None
    child_patent_number: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "ChildContinuity":
        c_filing_date = parse_to_date(data.get("childApplicationFilingDate"))
        return cls(
            first_inventor_to_file_indicator=data.get("firstInventorToFileIndicator"),
            child_application_status_code=data.get("childApplicationStatusCode"),
            parent_application_number_text=data.get("parentApplicationNumberText"),
            child_application_number_text=data.get("childApplicationNumberText"),
            child_application_status_description_text=data.get(
                "childApplicationStatusDescriptionText"
            ),
            child_application_filing_date=c_filing_date,
            child_patent_number=data.get("childPatentNumber"),
            claim_parentage_type_code=data.get("claimParentageTypeCode"),
            claim_parentage_type_code_description_text=data.get(
                "claimParentageTypeCodeDescriptionText"
            ),
            application_number_text=data.get("childApplicationNumberText"),
            filing_date=c_filing_date,
            status_code=data.get("childApplicationStatusCode"),
            status_description_text=data.get("childApplicationStatusDescriptionText"),
            patent_number=data.get("childPatentNumber"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "childApplicationStatusCode": self.child_application_status_code,
            "parentApplicationNumberText": self.parent_application_number_text,
            "childApplicationNumberText": self.child_application_number_text,
            "childApplicationStatusDescriptionText": self.child_application_status_description_text,
            "childApplicationFilingDate": serialize_date(
                self.child_application_filing_date
            ),
            "firstInventorToFileIndicator": self.first_inventor_to_file_indicator,
            "childPatentNumber": self.child_patent_number,
            "claimParentageTypeCode": self.claim_parentage_type_code,
            "claimParentageTypeCodeDescriptionText": self.claim_parentage_type_code_description_text,
        }





[docs]
@dataclass(frozen=True)
class PatentTermAdjustmentHistoryData:
    """Represents a single entry in the patent term adjustment (PTA) history for an application.

    Details specific events, dates, and day quantities affecting the patent term.
    """

    event_date: Optional[date] = None
    applicant_day_delay_quantity: Optional[float] = None
    event_description_text: Optional[str] = None
    event_sequence_number: Optional[float] = None
    ip_office_day_delay_quantity: Optional[float] = None
    originating_event_sequence_number: Optional[float] = None
    pta_pte_code: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "PatentTermAdjustmentHistoryData":
        return cls(
            event_date=parse_to_date(data.get("eventDate")),
            applicant_day_delay_quantity=data.get("applicantDayDelayQuantity"),
            event_description_text=data.get("eventDescriptionText"),
            event_sequence_number=data.get("eventSequenceNumber"),
            ip_office_day_delay_quantity=data.get("ipOfficeDayDelayQuantity"),
            originating_event_sequence_number=data.get(
                "originatingEventSequenceNumber"
            ),
            pta_pte_code=data.get("ptaPTECode"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        final_dict: Dict[str, Any] = {}
        if self.event_date is not None:
            final_dict["eventDate"] = serialize_date(self.event_date)
        if self.applicant_day_delay_quantity is not None:
            final_dict["applicantDayDelayQuantity"] = self.applicant_day_delay_quantity
        if self.event_description_text is not None:
            final_dict["eventDescriptionText"] = self.event_description_text
        if self.event_sequence_number is not None:
            final_dict["eventSequenceNumber"] = self.event_sequence_number
        if self.ip_office_day_delay_quantity is not None:
            final_dict["ipOfficeDayDelayQuantity"] = self.ip_office_day_delay_quantity
        if self.originating_event_sequence_number is not None:
            final_dict["originatingEventSequenceNumber"] = (
                self.originating_event_sequence_number
            )
        if self.pta_pte_code is not None:
            final_dict["ptaPTECode"] = self.pta_pte_code
        return final_dict





[docs]
@dataclass(frozen=True)
class PatentTermAdjustmentData:
    """Represents the overall patent term adjustment (PTA) data for an application.

    Includes various delay quantities (A, B, C, applicant, IP office), total adjustment,
    and a history of PTA events.
    """

    a_delay_quantity: Optional[float] = None
    adjustment_total_quantity: Optional[float] = None
    applicant_day_delay_quantity: Optional[float] = None
    b_delay_quantity: Optional[float] = None
    c_delay_quantity: Optional[float] = None
    filing_date: Optional[date] = None
    grant_date: Optional[date] = None
    non_overlapping_day_quantity: Optional[float] = None
    overlapping_day_quantity: Optional[float] = None
    ip_office_day_delay_quantity: Optional[float] = None
    patent_term_adjustment_history_data_bag: List[PatentTermAdjustmentHistoryData] = (
        field(default_factory=list)
    )


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "PatentTermAdjustmentData":
        history = [
            PatentTermAdjustmentHistoryData.from_dict(h)
            for h in data.get("patentTermAdjustmentHistoryDataBag", [])
            if isinstance(h, dict)
        ]
        return cls(
            a_delay_quantity=data.get("aDelayQuantity"),
            adjustment_total_quantity=data.get("adjustmentTotalQuantity"),
            applicant_day_delay_quantity=data.get("applicantDayDelayQuantity"),
            b_delay_quantity=data.get("bDelayQuantity"),
            c_delay_quantity=data.get("cDelayQuantity"),
            filing_date=parse_to_date(data.get("filingDate")),
            grant_date=parse_to_date(data.get("grantDate")),
            non_overlapping_day_quantity=data.get("nonOverlappingDayQuantity"),
            overlapping_day_quantity=data.get("overlappingDayQuantity"),
            ip_office_day_delay_quantity=data.get("ipOfficeDayDelayQuantity"),
            patent_term_adjustment_history_data_bag=history,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = asdict(self)
        d["filingDate"] = serialize_date(self.filing_date)
        d["grantDate"] = serialize_date(self.grant_date)
        d["patentTermAdjustmentHistoryDataBag"] = [
            h.to_dict() for h in self.patent_term_adjustment_history_data_bag
        ]
        return {
            to_camel_case(k): v
            for k, v in d.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class EventData:
    """Represents a single event in the transaction history of a patent application.

    Attributes:
        event_code: A code identifying the type of event.
        event_description_text: A textual description of the event.
        event_date: The date the event was recorded.
    """

    event_code: Optional[str] = None
    event_description_text: Optional[str] = None
    event_date: Optional[date] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "EventData":
        return cls(
            event_code=data.get("eventCode"),
            event_description_text=data.get("eventDescriptionText"),
            event_date=parse_to_date(data.get("eventDate")),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = asdict(self)
        d["eventDate"] = serialize_date(self.event_date)
        return {to_camel_case(k): v for k, v in d.items() if v is not None}





[docs]
@dataclass(frozen=True)
class PrintedMetaData:
    """Represents metadata for a specific archive file, such as a PGPUB or Grant XML file.

    Attributes:
        zip_file_name: The name of the ZIP archive.
        product_identifier: An identifier for the data product (e.g., "APPXML", "PTGRXML").
        file_location_uri: The URI where the document file can be accessed.
        file_create_date_time: The creation timestamp of the document file.
        xml_file_name: The name of the XML file within the ZIP archive.
    """

    zip_file_name: Optional[str] = None
    product_identifier: Optional[str] = None
    file_location_uri: Optional[str] = None
    file_create_date_time: Optional[datetime] = None
    xml_file_name: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "PrintedMetaData":
        return cls(
            zip_file_name=data.get("zipFileName"),
            product_identifier=data.get("productIdentifier"),
            file_location_uri=data.get("fileLocationURI"),
            file_create_date_time=parse_to_datetime_utc(data.get("fileCreateDateTime")),
            xml_file_name=data.get("xmlFileName"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        final_dict: Dict[str, Any] = {}
        if self.zip_file_name is not None:
            final_dict["zipFileName"] = self.zip_file_name
        if self.product_identifier is not None:
            final_dict["productIdentifier"] = self.product_identifier
        if self.file_location_uri is not None:
            final_dict["fileLocationURI"] = self.file_location_uri
        if self.file_create_date_time is not None:
            final_dict["fileCreateDateTime"] = serialize_datetime_as_iso(
                self.file_create_date_time
            )
        if self.xml_file_name is not None:
            final_dict["xmlFileName"] = self.xml_file_name
        return final_dict





[docs]
@dataclass(frozen=True)
class ApplicationMetaData:
    """Represents the comprehensive metadata associated with a patent application.

    This class holds a wide range of information including application status,
    dates (filing, grant, publication), applicant and inventor details,
    classification data, and other identifying information.
    """

    national_stage_indicator: Optional[bool] = None
    entity_status_data: Optional[EntityStatus] = None
    publication_date_bag: List[date] = field(default_factory=list)
    publication_sequence_number_bag: List[str] = field(default_factory=list)
    publication_category_bag: List[str] = field(default_factory=list)
    docket_number: Optional[str] = None
    first_inventor_to_file_indicator: Optional[bool] = None
    first_applicant_name: Optional[str] = None
    first_inventor_name: Optional[str] = None
    application_confirmation_number: Optional[str] = None
    application_status_date: Optional[date] = None
    application_status_description_text: Optional[str] = None
    filing_date: Optional[date] = None
    effective_filing_date: Optional[date] = None
    grant_date: Optional[date] = None
    group_art_unit_number: Optional[str] = None
    application_type_code: Optional[str] = None
    application_type_label_name: Optional[str] = None
    application_type_category: Optional[str] = None
    invention_title: Optional[str] = None
    patent_number: Optional[str] = None
    application_status_code: Optional[int] = None
    earliest_publication_number: Optional[str] = None
    earliest_publication_date: Optional[date] = None
    pct_publication_number: Optional[str] = None
    pct_publication_date: Optional[date] = None
    international_registration_publication_date: Optional[date] = None
    international_registration_number: Optional[str] = None
    examiner_name_text: Optional[str] = None
    class_field: Optional[str] = None
    subclass: Optional[str] = None
    uspc_symbol_text: Optional[str] = None
    customer_number: Optional[int] = None
    cpc_classification_bag: List[str] = field(default_factory=list)
    applicant_bag: List[Applicant] = field(default_factory=list)
    inventor_bag: List[Inventor] = field(default_factory=list)
    raw_data: Optional[str] = field(default=None, compare=False)

    @property
    def is_aia(self) -> Optional[bool]:
        return self.first_inventor_to_file_indicator

    @property
    def is_pre_aia(self) -> Optional[bool]:
        if self.first_inventor_to_file_indicator is None:
            return None
        return not self.first_inventor_to_file_indicator


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "ApplicationMetaData":
        entity = (
            EntityStatus.from_dict(data["entityStatusData"])
            if isinstance(data.get("entityStatusData"), dict)
            else None
        )
        app_bag = [
            Applicant.from_dict(a)
            for a in data.get("applicantBag", [])
            if isinstance(a, dict)
        ]
        inv_bag = [
            Inventor.from_dict(i)
            for i in data.get("inventorBag", [])
            if isinstance(i, dict)
        ]
        pub_dates_str = data.get("publicationDateBag", [])
        pub_dates = (
            [parse_to_date(d) for d in pub_dates_str if isinstance(d, str)]
            if isinstance(pub_dates_str, list)
            else []
        )
        fitf_indicator_str = data.get("firstInventorToFileIndicator")
        fitf_indicator_bool = parse_yn_to_bool(fitf_indicator_str)
        return cls(
            national_stage_indicator=data.get("nationalStageIndicator"),
            entity_status_data=entity,
            publication_date_bag=[d for d in pub_dates if d is not None],
            publication_sequence_number_bag=data.get(
                "publicationSequenceNumberBag", []
            ),
            publication_category_bag=data.get("publicationCategoryBag", []),
            docket_number=data.get("docketNumber"),
            first_inventor_to_file_indicator=fitf_indicator_bool,
            first_applicant_name=data.get("firstApplicantName"),
            first_inventor_name=data.get("firstInventorName"),
            application_confirmation_number=data.get("applicationConfirmationNumber"),
            application_status_date=parse_to_date(data.get("applicationStatusDate")),
            application_status_description_text=data.get(
                "applicationStatusDescriptionText"
            ),
            filing_date=parse_to_date(data.get("filingDate")),
            effective_filing_date=parse_to_date(data.get("effectiveFilingDate")),
            grant_date=parse_to_date(data.get("grantDate")),
            group_art_unit_number=data.get("groupArtUnitNumber"),
            application_type_code=data.get("applicationTypeCode"),
            application_type_label_name=data.get("applicationTypeLabelName"),
            application_type_category=data.get("applicationTypeCategory"),
            invention_title=data.get("inventionTitle"),
            patent_number=data.get("patentNumber"),
            application_status_code=data.get("applicationStatusCode"),
            earliest_publication_number=data.get("earliestPublicationNumber"),
            earliest_publication_date=parse_to_date(
                data.get("earliestPublicationDate")
            ),
            pct_publication_number=data.get("pctPublicationNumber"),
            pct_publication_date=parse_to_date(data.get("pctPublicationDate")),
            international_registration_publication_date=parse_to_date(
                data.get("internationalRegistrationPublicationDate")
            ),
            international_registration_number=data.get(
                "internationalRegistrationNumber"
            ),
            examiner_name_text=data.get("examinerNameText"),
            class_field=data.get("class"),
            subclass=data.get("subclass"),
            uspc_symbol_text=data.get("uspcSymbolText"),
            customer_number=data.get("customerNumber"),
            cpc_classification_bag=data.get("cpcClassificationBag", []),
            applicant_bag=app_bag,
            inventor_bag=inv_bag,
            raw_data=json.dumps(data),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        d = asdict(self)
        d.pop("raw_data", None)
        d.pop("is_aia", None)
        d.pop("is_pre_aia", None)
        date_fields = [
            "application_status_date",
            "filing_date",
            "effective_filing_date",
            "grant_date",
            "earliest_publication_date",
            "pct_publication_date",
            "international_registration_publication_date",
        ]
        for field_name in date_fields:
            camel_key = to_camel_case(field_name)
            d[camel_key] = serialize_date(getattr(self, field_name, None))
            if field_name != camel_key:
                d.pop(field_name, None)
        d["publicationDateBag"] = [
            serialize_date(dt) for dt in self.publication_date_bag if dt
        ]
        if (
            "publication_date_bag" in d
            and "publication_date_bag" != "publicationDateBag"
        ):
            d.pop("publication_date_bag")
        d["firstInventorToFileIndicator"] = serialize_bool_to_yn(
            self.first_inventor_to_file_indicator
        )
        if (
            "first_inventor_to_file_indicator" in d
            and "first_inventor_to_file_indicator" != "firstInventorToFileIndicator"
        ):
            d.pop("first_inventor_to_file_indicator")
        if self.entity_status_data:
            d["entityStatusData"] = self.entity_status_data.to_dict()
        else:
            d.pop("entityStatusData", None)
            d.pop("entity_status_data", None)
        d["applicantBag"] = [a.to_dict() for a in self.applicant_bag]
        if "applicant_bag" in d and "applicant_bag" != "applicantBag":
            d.pop("applicant_bag")
        d["inventorBag"] = [i.to_dict() for i in self.inventor_bag]
        if "inventor_bag" in d and "inventor_bag" != "inventorBag":
            d.pop("inventor_bag")
        if "class_field" in d:
            d["class"] = d.pop("class_field")
        if "class" in d and d["class"] is None:
            d.pop("class", None)
        final_data = {}
        for key_snake, v_obj in d.items():
            k_camel = to_camel_case(snake_str=key_snake)
            if key_snake in [
                "firstInventorToFileIndicator",
                "publicationDateBag",
                "entityStatusData",
                "applicantBag",
                "inventorBag",
            ] or any(to_camel_case(df) == key_snake for df in date_fields):
                k_camel = key_snake
            if v_obj is not None:
                if isinstance(v_obj, list) and not v_obj:
                    continue
                final_data[k_camel] = v_obj
        return final_data





[docs]
@dataclass(frozen=True)
class PatentFileWrapper:
    """Represents the complete file wrapper for a single patent application.

    This is a top-level object containing all data sections related to an application,
    such as metadata, addresses, assignments, attorney information, continuity data,
    PTA data, transaction events, and associated document metadata.
    """

    application_number_text: Optional[str] = None
    application_meta_data: Optional[ApplicationMetaData] = None
    correspondence_address_bag: List[Address] = field(default_factory=list)
    assignment_bag: List[Assignment] = field(default_factory=list)
    record_attorney: Optional[RecordAttorney] = None
    foreign_priority_bag: List[ForeignPriority] = field(default_factory=list)
    parent_continuity_bag: List[ParentContinuity] = field(default_factory=list)
    child_continuity_bag: List[ChildContinuity] = field(default_factory=list)
    patent_term_adjustment_data: Optional[PatentTermAdjustmentData] = None
    event_data_bag: List[EventData] = field(default_factory=list)
    pgpub_document_meta_data: Optional[PrintedMetaData] = None
    grant_document_meta_data: Optional[PrintedMetaData] = None
    last_ingestion_date_time: Optional[datetime] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "PatentFileWrapper":
        amd_json = data.get("applicationMetaData")
        amd = (
            ApplicationMetaData.from_dict(amd_json)
            if isinstance(amd_json, dict)
            else None
        )
        corr_addrs = [
            Address.from_dict(a)
            for a in data.get("correspondenceAddressBag", [])
            if isinstance(a, dict)
        ]
        assigns = [
            Assignment.from_dict(a)
            for a in data.get("assignmentBag", [])
            if isinstance(a, dict)
        ]
        rec_att_json = data.get("recordAttorney")
        rec_att = (
            RecordAttorney.from_dict(rec_att_json)
            if isinstance(rec_att_json, dict)
            else None
        )
        f_pris = [
            ForeignPriority.from_dict(fp)
            for fp in data.get("foreignPriorityBag", [])
            if isinstance(fp, dict)
        ]
        p_conts = [
            ParentContinuity.from_dict(pc)
            for pc in data.get("parentContinuityBag", [])
            if isinstance(pc, dict)
        ]
        c_conts = [
            ChildContinuity.from_dict(cc)
            for cc in data.get("childContinuityBag", [])
            if isinstance(cc, dict)
        ]
        pta_json = data.get("patentTermAdjustmentData")
        pta = (
            PatentTermAdjustmentData.from_dict(pta_json)
            if isinstance(pta_json, dict)
            else None
        )
        evts = [
            EventData.from_dict(e)
            for e in data.get("eventDataBag", [])
            if isinstance(e, dict)
        ]
        pgpub_json = data.get("pgpubDocumentMetaData")
        pgpub = (
            PrintedMetaData.from_dict(pgpub_json)
            if isinstance(pgpub_json, dict)
            else None
        )
        grant_json = data.get("grantDocumentMetaData")
        grant = (
            PrintedMetaData.from_dict(grant_json)
            if isinstance(grant_json, dict)
            else None
        )
        return cls(
            application_number_text=data.get("applicationNumberText"),
            application_meta_data=amd,
            correspondence_address_bag=corr_addrs,
            assignment_bag=assigns,
            record_attorney=rec_att,
            foreign_priority_bag=f_pris,
            parent_continuity_bag=p_conts,
            child_continuity_bag=c_conts,
            patent_term_adjustment_data=pta,
            event_data_bag=evts,
            pgpub_document_meta_data=pgpub,
            grant_document_meta_data=grant,
            last_ingestion_date_time=parse_to_datetime_utc(
                data.get("lastIngestionDateTime")
            ),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        _dict = {
            "applicationNumberText": self.application_number_text,
            "applicationMetaData": (
                self.application_meta_data.to_dict()
                if self.application_meta_data
                else None
            ),
            "correspondenceAddressBag": [
                a.to_dict() for a in self.correspondence_address_bag
            ],
            "assignmentBag": [a.to_dict() for a in self.assignment_bag],
            "recordAttorney": (
                self.record_attorney.to_dict() if self.record_attorney else None
            ),
            "foreignPriorityBag": [fp.to_dict() for fp in self.foreign_priority_bag],
            "parentContinuityBag": [pc.to_dict() for pc in self.parent_continuity_bag],
            "childContinuityBag": [cc.to_dict() for cc in self.child_continuity_bag],
            "patentTermAdjustmentData": (
                self.patent_term_adjustment_data.to_dict()
                if self.patent_term_adjustment_data
                else None
            ),
            "eventDataBag": [e.to_dict() for e in self.event_data_bag],
            "pgpubDocumentMetaData": (
                self.pgpub_document_meta_data.to_dict()
                if self.pgpub_document_meta_data
                else None
            ),
            "grantDocumentMetaData": (
                self.grant_document_meta_data.to_dict()
                if self.grant_document_meta_data
                else None
            ),
            "lastIngestionDateTime": serialize_datetime_as_iso(
                self.last_ingestion_date_time
            ),
        }
        return {
            k: v
            for k, v in _dict.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class PatentDataResponse:
    """Represents the overall response from a patent data API request.

    It typically includes a count of the results and a list of PatentFileWrapper objects,
    each containing detailed data for a patent application.
    """

    count: int
    patent_file_wrapper_data_bag: List[PatentFileWrapper] = field(default_factory=list)
    # TODO: raw as response in json


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "PatentDataResponse":
        wrappers = [
            PatentFileWrapper.from_dict(w)
            for w in data.get("patentFileWrapperDataBag", [])
            if isinstance(w, dict)
        ]
        return cls(count=data.get("count", 0), patent_file_wrapper_data_bag=wrappers)



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "count": self.count,
            "patentFileWrapperDataBag": [
                w.to_dict() for w in self.patent_file_wrapper_data_bag
            ],
        }



[docs]
    def to_csv(self) -> str:
        """
        Converts the patent data in this response to a CSV formatted string.

        The CSV will contain the following headers:
        - inventionTitle
        - applicationNumberText
        - filingDate
        - applicationTypeLabelName
        - publicationCategoryBag (pipe-separated if multiple)
        - applicationStatusDescriptionText
        - applicationStatusDate
        - firstInventorName

        Returns:
            A string containing the data in CSV format.
        """
        headers = [
            "inventionTitle",
            "applicationNumberText",
            "filingDate",
            "applicationTypeLabelName",
            "publicationCategoryBag",
            "applicationStatusDescriptionText",
            "applicationStatusDate",
            "firstInventorName",
        ]

        output = io.StringIO()
        writer = csv.writer(output)

        writer.writerow(headers)

        if not self.patent_file_wrapper_data_bag:
            return output.getvalue()

        for wrapper in self.patent_file_wrapper_data_bag:
            if not wrapper.application_meta_data:
                continue

            meta = wrapper.application_meta_data

            pub_category_str = (
                "|".join(meta.publication_category_bag)
                if meta.publication_category_bag
                else ""
            )

            row_data = [
                meta.invention_title or "",
                wrapper.application_number_text or "",
                serialize_date(meta.filing_date) or "",
                meta.application_type_label_name or "",
                pub_category_str,
                meta.application_status_description_text or "",
                serialize_date(meta.application_status_date) or "",
                meta.first_inventor_name or "",
            ]
            writer.writerow(row_data)

        return output.getvalue()





[docs]
@dataclass(frozen=True)
class StatusCode:
    """Represents a USPTO application status code and its textual description.

    Attributes:
        code: The numeric status code.
        description: The textual description of the status code.
    """

    code: Optional[int] = None
    description: Optional[str] = None

    def __str__(self) -> str:
        return f"{self.code}: {self.description}"


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "StatusCode":
        if "code" in data:
            return cls(
                code=data.get("code"),
                description=data.get("description"),
            )
        else:
            return cls(
                code=data.get("applicationStatusCode"),
                description=data.get("applicationStatusDescriptionText"),
            )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "applicationStatusCode": self.code,
            "applicationStatusDescriptionText": self.description,
        }





[docs]
class StatusCodeCollection:
    """A collection of StatusCode objects.

    Provides iterable access and helper methods to find or filter status codes.
    """

    def __init__(self, status_codes: List[StatusCode]):
        self._status_codes: tuple[StatusCode, ...] = tuple(status_codes)

    def __iter__(self) -> Iterator[StatusCode]:
        return iter(self._status_codes)

    def __len__(self) -> int:
        return len(self._status_codes)

    def __getitem__(self, index: int) -> StatusCode:
        return self._status_codes[index]

    def __str__(self) -> str:
        return f"StatusCodeCollection with {len(self)} status codes."

    def __repr__(self) -> str:
        if not self._status_codes:
            return "StatusCodeCollection(empty)"

        if len(self._status_codes) <= 3:
            codes = ", ".join(str(s.code) for s in self._status_codes)
            return f"StatusCodeCollection({len(self)} status codes: {codes})"
        else:
            first_codes = ", ".join(str(s.code) for s in self._status_codes[:3])
            return f"StatusCodeCollection({len(self)} status codes: {first_codes}, ...)"


[docs]
    def find_by_code(self, code_to_find: int) -> Optional[StatusCode]:
        for status in self._status_codes:
            if status.code == code_to_find:
                return status
        return None



[docs]
    def search_by_description(self, text: str) -> "StatusCodeCollection":
        matching = [
            s
            for s in self._status_codes
            if s.description and text.lower() in s.description.lower()
        ]
        return StatusCodeCollection(status_codes=matching)



[docs]
    def to_dict(self) -> List[Dict[str, Any]]:
        return [sc.to_dict() for sc in self._status_codes]





[docs]
@dataclass(frozen=True)
class StatusCodeSearchResponse:
    """Represents the response from a search query for patent application status codes.

    Attributes:
        count: The total number of status codes found matching the query.
        status_code_bag: A collection of the StatusCode objects returned.
        request_identifier: An identifier for the API request.
    """

    count: int
    status_code_bag: StatusCodeCollection
    request_identifier: Optional[str] = None


[docs]
    @classmethod
    def from_dict(cls, data: Dict[str, Any]) -> "StatusCodeSearchResponse":
        codes_json = data.get("statusCodeBag", [])
        parsed_codes = (
            [StatusCode.from_dict(cd) for cd in codes_json if isinstance(cd, dict)]
            if isinstance(codes_json, list)
            else []
        )
        collection = StatusCodeCollection(parsed_codes)
        return cls(
            count=data.get("count", 0),
            status_code_bag=collection,
            request_identifier=data.get("requestIdentifier"),
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        _dict = {
            "count": self.count,
            "statusCodeBag": self.status_code_bag.to_dict(),
            "requestIdentifier": self.request_identifier,
        }
        return {
            k: v
            for k, v in _dict.items()
            if v is not None and (not isinstance(v, list) or v)
        }





[docs]
@dataclass(frozen=True)
class ApplicationContinuityData:
    """Holds parent and child continuity application data for a specific patent application.

    This class consolidates lists of ParentContinuity and ChildContinuity objects,
    representing the lineage of an application.
    """

    parent_continuity_bag: List[ParentContinuity] = field(default_factory=list)
    child_continuity_bag: List[ChildContinuity] = field(default_factory=list)


[docs]
    @classmethod
    def from_wrapper(cls, wrapper: PatentFileWrapper) -> "ApplicationContinuityData":
        return cls(
            parent_continuity_bag=wrapper.parent_continuity_bag,
            child_continuity_bag=wrapper.child_continuity_bag,
        )



[docs]
    def to_dict(
        self,
    ) -> Dict[str, Any]:
        return {
            "parentContinuityBag": [pc.to_dict() for pc in self.parent_continuity_bag],
            "childContinuityBag": [cc.to_dict() for cc in self.child_continuity_bag],
        }





[docs]
@dataclass(frozen=True)
class PrintedPublication:
    """Holds metadata for associated documents like Pre-Grant Publications (PGPUB)
    and Grant documents for a specific patent application.
    """

    pgpub_document_meta_data: Optional[PrintedMetaData] = None
    grant_document_meta_data: Optional[PrintedMetaData] = None


[docs]
    @classmethod
    def from_wrapper(cls, wrapper: PatentFileWrapper) -> "PrintedPublication":
        return cls(
            pgpub_document_meta_data=wrapper.pgpub_document_meta_data,
            grant_document_meta_data=wrapper.grant_document_meta_data,
        )



[docs]
    def to_dict(self) -> Dict[str, Any]:
        return {
            "pgpubDocumentMetaData": (
                self.pgpub_document_meta_data.to_dict()
                if self.pgpub_document_meta_data
                else None
            ),
            "grantDocumentMetaData": (
                self.grant_document_meta_data.to_dict()
                if self.grant_document_meta_data
                else None
            ),
        }