HDH Graph Databases
Run deze instructie:
- vanaf een OND
- zonder Pulse
- zonder Caleidos, dus via een hotspot
Installatie repo
- clone de repo van github
poetry install
Installatie Neo4j Desktop
-
installeer Neo4J Desktop via https://neo4j.com/download/
-
start neo4j en voeg de key toe die je krijgt op de download pagina
-
maak nieuw project
-
Voeg Local DBMS toe via Add
-
Start DBMS
-
Voeg remote DBMS toe met de volgende credentials
- NEO4J_URI=neo4j+s://.databases.neo4j.io
- NEO4J_USERNAME=neo4j
- NEO4J_PASSWORD=
- AURA_INSTANCENAME=form13
Bekijke https://docs.google.com/presentation/d/1WvPzs_JEh8uuKEAQGecH1rUd1NoRzqZIKc-hQkuBdXQ/edit?usp=sharing
Data
De dataset bevat de kwartaalaangiften van vermogensbeheerders met meer dan 100 miljoen dollar beheerd vermogen. Dit zijn deponeringen bij het EDGAR-systeem van de Securities and Exchange Commission (SEC) - de openbare deponeringen van iets dat Form 13 wordt genoemd. Vermogensbeheerders met meer dan $100m assets under management (AUM) moeten elk kwartaal formulier 13 indienen. Dat is dan beschikbaar voor het publiek via http. Ons doel is om de relaties van verschillende vermogensbeheerders en hun holdings te onderzoeken in een graph representatie. Verder proberen we met graph node embeddings te voorspellen welke holdings vermogensbeheerders in het volgende kwartaal zullen aanhouden.
Upload en browse data
Bekijk https://docs.google.com/presentation/d/1O6Oy_GbDYYCvQanUyUCl30hQdSsy9kKL53Jgl23Nnsk/edit?usp=sharing
Volg de instructies op https://github.com/neo4j-partners/hands-on-lab-neo4j-and-vertex-ai/tree/main/Lab%203%20-%20Moving%20Data met de lokale dbs en stop bij "A Year of Data".
Wij hebben "A Year of Data" voor je gereed gezet op de remote DBMS; de lokale dbms is te klein.
Exploratie
Open Bloom van de Remote DBMS via Neo4j Desktop en volg de instructies op
- https://github.com/neo4j-partners/hands-on-lab-neo4j-and-vertex-ai/tree/main/Lab%204%20-%20Exploration
- exploring_cypher.ipynb
- exploring_pandas.ipynb
Exploratie Deep Dive - Graph Algorithms
- exploring_graph_algorithms.ipynb
Graph Data Science
Bekijk https://docs.google.com/presentation/d/133tXAH--V7Uvyd0Ylhs08_xDEPfl64uvaNNdxeHVpvk/edit?usp=sharing
- Volg embeddings.ipynb
- Nu is het moment gekomen om onze graph embeddings aan het voorspellingsmodel toe te voegen en te proberen te voorspellen welke holdings door de vermogensbeheerders zullen worden geschrapt. Gebruik je favoriete classifier en creativiteit! :)
- Deze code kan je waarschijnlijk helpen met het opschonen en voorbereiden van de data: https://github.com/neo4j-partners/neo4j-sec-edgar-form13/blob/main/featurize/featurize.py