refactored project to use poetry

2025-05-20 22:19:30 -05:00
parent 3beb160c22
commit b3da128396
20 changed files with 5113 additions and 23 deletions
--- a/.DS_Store
+++ b/.DS_Store
--- a/README.md
+++ b/README.md
@@ -1,2 +1,17 @@
 # rag-system
 ## Initialization
 ```bash
 poetry install
 ```
 ## Running
 ### Crawler
 ### Clear Index
 ```bash
 poetry run python src/clearIndex.py
 ```
--- a/poetry.lock
+++ b/poetry.lock
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -0,0 +1,34 @@
 [tool.poetry]
 name = "rag-system"
 version = "0.1.0"
 description = "A simple RAG (Retrieval-Augmented Generation) system"
 authors = ["Peter Morton <Peter.Morton@verint.com>"]
 readme = "README.md"
 [tool.poetry.dependencies]
 python = "^3.12"
 black = "^25.1.0"
 flake8 = "^7.2.0"
 python-dotenv = "^1.1.0"
 azure-identity = "^1.23.0"
 azure-search-documents = "^11.5.2"
 firecrawl-py = "^2.7.0"
 tiktoken = "^0.9.0"
 bs4 = "^0.0.2"
 langchain-ollama = "^0.3.3"
 langchain-openai = "^0.3.17"
 langchain-chroma = "^0.2.4"
 langchain-community = "^0.3.24"
 langchain = "^0.3.25"
 chromadb = "^1.0.9"
 pypdf = "^5.5.0"
 streamlit = "^1.45.1"
 ollama = "^0.4.8"
 [tool.poetry.scripts]
 crawler = "rag_system.crawler:main"
 clear-index = "rag_system.clear_index:main"
 [build-system]
 requires = ["poetry-core"]
 build-backend = "poetry.core.masonry.api"
--- a/rag_system/init.py
+++ b/rag_system/init.py
--- a/rag_system/app/init.py
+++ b/rag_system/app/init.py
--- a/rag_system/app/rag_chain.py
+++ b/rag_system/app/rag_chain.py
--- a/rag_system/app/streamlit_app.py
+++ b/rag_system/app/streamlit_app.py
@@ -1,5 +1,5 @@
 import streamlit as st
-from app.rag_chain import get_rag_response
+from rag_system.app.rag_chain import get_rag_response
 st.title("RAG System")
 query = st.text_input("Ask a question:")
--- a/rag_system/clear_index.py
+++ b/rag_system/clear_index.py
@@ -1,4 +1,4 @@
-from vectordb.azure_search import delete_all_documents
+from rag_system.vectordb.azure_search import delete_all_documents
 def main():
--- a/rag_system/crawler.py
+++ b/rag_system/crawler.py
@@ -1,6 +1,6 @@
-from loaders.pdf_loader import load_pdf
+from rag_system.loaders.pdf_loader import load_pdf
-from loaders.web_loader import load_web_crawl
+from rag_system.loaders.web_loader import load_web_crawl
-from vectordb.azure_search import add_documents
+from rag_system.vectordb.azure_search import add_documents
 def main():
@@ -13,7 +13,7 @@ def main():
    add_documents(pdf_documents)
    # add_documents(web_documents)
    print("Embeddings stored. You can now run the Streamlit app with:\n")
-    print("   streamlit run app/streamlit_app.py")
+    print("   streamlit run rag_system/app/streamlit_app.py")
 if __name__ == "__main__":
--- a/rag_system/llm/init.py
+++ b/rag_system/llm/init.py
--- a/rag_system/llm/ollama.py
+++ b/rag_system/llm/ollama.py
--- a/rag_system/loaders/init.py
+++ b/rag_system/loaders/init.py
--- a/rag_system/loaders/firecrawl.py
+++ b/rag_system/loaders/firecrawl.py
--- a/rag_system/loaders/pdf_loader.py
+++ b/rag_system/loaders/pdf_loader.py
--- a/rag_system/loaders/web_loader.py
+++ b/rag_system/loaders/web_loader.py
@@ -1,6 +1,6 @@
 from langchain_community.document_loaders import WebBaseLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-from loaders.firecrawl import FireCrawlLoader
+from rag_system.loaders.firecrawl import FireCrawlLoader
 def load_web_crawl(url):
--- a/rag_system/vectordb/init.py
+++ b/rag_system/vectordb/init.py
--- a/rag_system/vectordb/azure_search.py
+++ b/rag_system/vectordb/azure_search.py
--- a/rag_system/vectordb/chromadb.py
+++ b/rag_system/vectordb/chromadb.py
--- a/requirements.txt
+++ b/requirements.txt
@@ -1,16 +0,0 @@
 langchain
 langchain-community
 langchain-chroma
 langchain-openai
 chromadb
 pypdf
 streamlit
 ollama
 langchain_ollama
 bs4
 tiktoken
 firecrawl-py
 azure-search-documents
 azure-identity
 python-dotenv
 black
`@@ -1,4 +1,4 @@`
	`from vectordb.azure_search import delete_all_documents`	`from rag_system.vectordb.azure_search import delete_all_documents`


	`def main():`	`def main():`